1.3. Com classifiquem les IA
La classificació de la intel·ligència artificial es pot fer de diverses maneres, com ara segons l’aprenentatge, el funcionament, les característiques o els objectius. Enfocarem la classificació en funció del tipus d’aprenentatge.
- IA d’aprenentatge automàtic (machine learning). L’objectiu és que els sistemes informàtics aprenguin i millorin mitjançant dades, sense requerir programació explícita. Hi ha tres subcategories importants:
- IA supervisada. Utilitza dades etiquetades per entrenar algorismes, de manera que els permet fer prediccions precises sobre dades noves. S’utilitza, per exemple, en aplicacions com ara la classificació de correu electrònic (per diferenciar el correu brossa del que no ho és) o el diagnòstic mèdic (diagnòstic de melanomes).
- IA no supervisada. Aprèn de dades no etiquetades per descobrir patrons ocults o agrupar dades. S’inclouen tasques com ara l’agrupament i la reducció de la dimensió, útils per a l’anàlisi de dades i la segmentació de clients, per exemple.
- IA per reforç (reinforcement learning). Apresa per mitjà de la interacció amb un entorn dinàmic, pren decisions amb retroalimentació en forma de recompenses o penalitzacions. S’utilitza, per exemple, en aplicacions des de la conducció autònoma fins a la formació de robots.
- IA d’aprenentatge profund. És una branca de la intel·ligència artificial que utilitza models de xarxes neuronals per aprendre i comprendre patrons complexos a partir de dades. Aquestes serien algunes característiques que la defineixen:
- Xarxes neuronals profundes. Les xarxes neuronals profundes consisteixen en diverses capes de neurones interconnectades, inspirades en el funcionament del cervell humà. Cada capa processa informació i transmet la sortida a les capes següents, de manera que permet un aprenentatge jeràrquic.
- Capacitat de representació. Amb múltiples capes, aquest tipus d’IA pot aprendre a representar patrons de dades molt complexos. Aquesta capacitat fa que sigui adequada per a tasques com ara el reconeixement d’imatges, el processament del llenguatge natural i altres àmbits amb dades complicades.
- Aprenentatge jeràrquic. Les capes successives aprenen característiques a diferents nivells d’abstracció. Per exemple, en el reconeixement d’imatges, les capes inicials poden detectar formes bàsiques, mentre que les capes més profundes poden identificar patrons més complexos.
- Processament d’entrada amb moltes dimensions. Les dimensions es refereixen als diferents atributs o variables que descriuen cada instància de les dades. La capacitat de manipular gran quantitat de dades amb moltes dimensions és bàsica en moltes aplicacions, ja que permet als models captar detalls subtils i complexos en les dades.
- Gran quantitat de dades i potència de càlcul. L’entrenament d’aquests models necessita quantitats enormes de dades per obtenir uns resultats òptims. Això implica disposar d’ordinadors amb una gran capacitat de càlcul.
- Aplicacions de la IA d’aprenentatge profund.
- Reconeixement d’imatges. Identificació d’objectes i patrons en imatges, com per exemple la classificació de gats i gossos.
- Processament del llenguatge natural (PNL). Per exemple, traducció automàtica, anàlisi de sentiments o generació de text, entre altres.
- Visió per ordinador. Detecció de cares, segmentació d’objectes, etc.
- Reconeixement de la veu. Transformació de veu a text i a l’inrevés.
- Jocs d’ordinador. Aprenentatge de polítiques òptimes en jocs com ara el Go o els videojocs.
- Codi de llenguatge de programació. Generació o modificació de codi de programes.
La intel·ligència artificial generativa estaria dins d’aquest grup d’IA d’aprenentatge profund. És a dir, si ho representem gràficament, quedaria d’aquesta manera:
Aquesta intel·ligència, la IAG, aprèn de les dades de manera automàtica. Analitza quantitats immenses de dades i troba patrons i relacions que altrament serien difícils de detectar, i crea material original a partir d’aquestes dades.
La intel·ligència artificial generativa utilitza com a marc de treball les xarxes generatives antagòniques (GAN, sigla de l’anglès generative adversarial networks), dues xarxes neuronals: una de generadora i una altra de discriminadora. La generadora s’encarrega de crear contingut nou, mentre que la discriminadora s’encarrega d’avaluar si el contingut generat és real o fals. Aquesta interacció entre la generadora i la discriminadora permet que la IA aprengui de les dades de manera eficaç i eficient, i genera contingut nou d’alta qualitat i realista.