1. Concepte
L’aprenentatge no supervisat (Unsupervised Learning) és una tècnica de la intel·ligència artificial en què un algorisme aprèn a identificar patrons i estructures en dades no etiquetades. Aquesta metodologia s’utilitza per descobrir relacions ocultes en les dades, agrupar elements similars i reduir la dimensionalitat de les dades.
2. Definició acadèmica precisa
L’aprenentatge no supervisat és una branca de l’aprenentatge automàtic on els algoritmes s’utilitzen per analitzar i modelar dades sense la necessitat de dades etiquetades. A diferència de l’aprenentatge supervisat, on l’algoritme aprèn a partir d’un conjunt de dades etiquetades amb les respostes correctes, l’aprenentatge no supervisat treballa amb dades que no tenen etiquetes predefinides.
Els objectius principals de l’aprenentatge no supervisat inclouen la clustering (agrupament), la reducció de dimensionalitat i l’associació. En el clustering, l’algoritme agrupa els punts de dades en clústers o grups basats en la seva similitud. Això és útil en aplicacions com la segmentació de mercat, on els clients es poden agrupar segons el seu comportament de compra.
Un dels algorismes més comuns en el clustering és el K-means, que assigna cada punt de dades a un dels K clústers en funció de la distància mínima entre el punt i el centre del clúster. L’algoritme ajusta iterativament els centres dels clústers fins a aconseguir una configuració òptima que minimitzi la variabilitat dins de cada clúster.
La reducció de dimensionalitat és una altra aplicació important de l’aprenentatge no supervisat. Algorismes com l’Anàlisi de Components Principals (PCA) s’utilitzen per reduir el nombre de variables en un conjunt de dades mentre es manté la informació més rellevant. Això ajuda a simplificar els models, millorar la seva interpretabilitat i reduir el temps de processament.
L’associació implica descobrir regles d’associació en grans bases de dades, com ara patrons de compra en el comerç al detall. L’algoritme Apriori és un dels més coneguts en aquest camp, i s’utilitza per identificar conjunts d’articles que es compren freqüentment junts.
L’aprenentatge no supervisat és fonamental en moltes àrees, incloent la biologia computacional, l’anàlisi de xarxes socials, la detecció de fraus i la visió per computadora. La seva capacitat per descobrir patrons ocults en dades sense etiquetes el fa indispensable per a l’exploració de dades i el descobriment de coneixement.
Tot i els seus avantatges, l’aprenentatge no supervisat presenta desafiaments. L’absència d’etiquetes fa que sigui difícil avaluar la qualitat dels models, i els resultats sovint requereixen interpretació manual. A més, l’algoritme pot identificar patrons que no són significatius des del punt de vista pràctic.
3. Definició simplificada
L’aprenentatge no supervisat és una tècnica en què els algoritmes identifiquen patrons i estructures en dades no etiquetades, útil per descobrir relacions ocultes i agrupar elements similars.
4. Metàfora per entendre-ho
L’aprenentatge no supervisat és com explorar una ciutat desconeguda sense mapa. A mesura que camines, comences a reconèixer barris amb característiques similars i a trobar rutes eficients, fins i tot sense conèixer els noms dels llocs o tenir informació prèvia.
5. Dita catalana relacionada
Cada ovella amb la seva parella.
Aquesta dita significa que les persones tendeixen a agrupar-se amb aquelles que són similars a elles. En el context de l’aprenentatge no supervisat, els algoritmes agrupen dades similars en clústers, descobrint estructures ocultes sense necessitat d’informació prèvia.