L’apprendimento automatico, il sottoinsieme dell’intelligenza artificiale che insegna ai computer a svolgere compiti attraverso esempi ed esperienze, è una zona calda di ricerca e sviluppo. Molte delle applicazioni che utilizziamo quotidianamente utilizzano algoritmi di apprendimento automatico, inclusi assistenti di intelligenza artificiale, ricerca web e traduzione automatica.
Il tuo feed di notizie sui social media è alimentato da un algoritmo di apprendimento automatico. I video consigliati che vedi su YouTube e Netflix sono il risultato di un modello di apprendimento automatico. E Discover Weekly di Spotify si basa sulla potenza degli algoritmi di apprendimento automatico per creare un elenco di brani conformi alle tue preferenze.
Ma l’apprendimento automatico ha molti gusti diversi. In questo post, esploreremo l’apprendimento supervisionato e non supervisionato, le due principali categorie di algoritmi di apprendimento automatico. Ogni sottoinsieme è composto da molti algoritmi diversi adatti per varie attività.
Una nota molto veloce sull’apprendimento automatico
Prima di approfondire l’apprendimento supervisionato e non supervisionato, diamo una panoramica ingrandita di ciò che è l’apprendimento automatico.
Nella loro forma più semplice, i sistemi di intelligenza artificiale di oggi trasformano gli input in output. Ad esempio, un classificatore di immagini prende immagini o fotogrammi video come input e genera il tipo di oggetti contenuti nell’immagine. Un algoritmo di rilevamento delle frodi prende i dati di pagamento come input e genera la probabilità che la transazione sia fraudolenta. Un’intelligenza artificiale che gioca a scacchi prende lo stato corrente della scacchiera come input ed emette la mossa successiva.
Gli approcci classici allo sviluppo di sistemi di intelligenza, noti come intelligenza artificiale simbolica , richiedevano ai programmatori di specificare esplicitamente le regole che associavano gli input agli output. Sebbene ci siano molti vantaggi nell’IA simbolica, ha un uso limitato in campi in cui l’input può arrivare in molte forme diverse come visione del computer, riconoscimento vocale e elaborazione del linguaggio naturale.
Al contrario, l’apprendimento automatico utilizza un approccio diverso allo sviluppo del comportamento. Durante la creazione di un sistema ML, lo sviluppatore crea una struttura generale e la forma su molti esempi. Questi esempi possono essere immagini con le immagini corrispondenti, i dati della partita a scacchi, gli oggetti acquistati dai clienti, i brani ascoltati dagli utenti o qualsiasi altro dato rilevante per il problema che il modello AI vuole risolvere. Dopo aver analizzato i dati di addestramento, l’algoritmo di machine learning sintonizza i suoi parametri interni per essere in grado di gestire i nuovi dati di input.
Apprendimento supervisionato
La regressione logistica è un tipo di algoritmo di apprendimento automatico supervisionato che può classificare input in diverse classi
Se segui le notizie sull’intelligenza artificiale, probabilmente avrai sentito che gli algoritmi di intelligenza artificiale necessitano di molti esempi con etichetta umana. Queste storie si riferiscono all’apprendimento supervisionato, la categoria più popolare di algoritmi di apprendimento automatico.
L’apprendimento automatico supervisionato si applica a situazioni in cui si conosce l’esito dei dati di input. Supponi di voler creare un algoritmo di apprendimento automatico della classificazione delle immagini in grado di rilevare immagini di gatti, cani e cavalli.
Per addestrare il modello AI, è necessario raccogliere un ampio set di dati di foto di gatti, cani e cavalli. Ma prima di alimentarli con l’algoritmo di apprendimento automatico, è necessario annotarli con il nome delle rispettive classi. L’annotazione potrebbe includere l’inserimento delle immagini di ciascuna classe in una cartella separata, l’utilizzo di una convenzione di denominazione dei file o l’aggiunta di metadati al file di immagine. Questo è il laborioso compito manuale a cui si fa spesso riferimento nelle storie che menzionano I felpe AI.
Una volta etichettati i dati, l’algoritmo di machine learning (ad es. Una rete neurale convoluzionale o una macchina vettoriale di supporto) elabora gli esempi e sviluppa una matematica modello in grado di mappare ogni immagine alla sua classe corretta. Se il modello AI viene addestrato su esempi abbastanza etichettati, sarà in grado di rilevare con precisione la classe di nuove immagini che contengono gatti, cani, cavalli.
L’apprendimento automatico supervisionato risolve due tipi di problemi: classificazione e regressione. L’esempio spiegato sopra è un problema di classificazione, in cui il modello di apprendimento automatico deve inserire input in specifici segmenti o categorie. Un altro esempio di un problema di classificazione è il riconoscimento vocale.
I modelli di apprendimento automatico della regressione non si limitano a categorie specifiche. Possono avere valori continui e infiniti, come ad esempio quanto pagherà un cliente per un prodotto o la probabilità che pioverà domani.
Alcuni algoritmi di apprendimento supervisionato comuni includono quanto segue:
- Regressione lineare e logistica
- Naïve Bayes
- Supporto macchine vettoriali
- Alberi decisionali e foreste casuali
- Reti neurali artificiali
- Apprendimento non supervisionato
Gli algoritmi di apprendimento automatico senza supervisione possono dividere i dati in cluster in base alle loro caratteristiche condivise
Supponiamo che tu sia un proprietario di e-commerce al dettaglio che ha migliaia di record di vendita dei clienti. Vuoi scoprire quali clienti hanno condiviso le abitudini di acquisto in modo da poter utilizzare le informazioni per formulare raccomandazioni pertinenti e migliorare la tua politica di upsell. Il problema è che non hai categorie predefinite in cui suddividere i tuoi clienti. Pertanto, non puoi formare un modello di apprendimento automatico supervisionato per classificare i tuoi clienti.
Questo è un problema di clustering, l’uso principale dell’apprendimento automatico non supervisionato. A differenza dell’apprendimento supervisionato, l’apprendimento automatico non supervisionato non richiede dati etichettati. Esamina gli esempi di addestramento e li divide in gruppi in base alle loro caratteristiche condivise.
Un algoritmo di apprendimento automatico non supervisionato ben addestrato dividerà i tuoi clienti in cluster pertinenti. Questo ti aiuterà a prevedere i prodotti che i clienti compreranno in base alle loro preferenze condivise con altre persone nel loro cluster.
K-means è un noto algoritmo di apprendimento automatico del clustering senza supervisione. Una delle sfide dell’uso di k-means è sapere in quanti cluster suddividere i dati. Troppo pochi comprimeranno i dati che non sono molto simili mentre troppi cluster renderanno il tuo modello complesso e impreciso.
Oltre al raggruppamento, l’apprendimento senza supervisione può anche eseguire la riduzione della dimensionalità. È possibile utilizzare la riduzione della dimensionalità quando si dispone di un set di dati con troppe funzioni. Supponi di avere una tabella di informazioni sui tuoi clienti, che ha 100 colonne. Avere così tanti dati sui tuoi clienti potrebbe sembrare interessante. Ma in realtà non lo è.
All’aumentare del numero di funzioni nei tuoi dati, avrai anche bisogno di un set di campioni più ampio per formare un modello di apprendimento automatico accurato. Potresti non avere abbastanza campioni per addestrare una 100 – colonna modello. Troppe funzioni aumentano anche le possibilità di overfitting, il che significa che il tuo modello di intelligenza artificiale si comporta bene sui dati di allenamento ma scarsamente su altri dati.
Gli algoritmi di machine learning senza supervisione possono analizzare i dati e trovare le funzionalità che sono meno rilevanti e possono essere eliminate per semplificare il modello senza perdere preziose informazioni. Ad esempio, nel caso della nostra tabella dei clienti, dopo averlo eseguito attraverso l’algoritmo di riduzione della dimensionalità, potremmo scoprire che le funzionalità relative all’età e all’indirizzo di residenza del cliente hanno poca rilevanza e possiamo rimuoverle.
L’analisi dei componenti di principio (PCA) è un popolare algoritmo di machine learning per la riduzione della dimensionalità.
Alcuni analisti della sicurezza usano anche l’apprendimento automatico non supervisionato per il rilevamento di anomalie per identificare attività dannose nella rete di un’organizzazione.
Uno dei vantaggi dell’apprendimento non supervisionato è che non richiede il laborioso processo di etichettatura dei dati che l’apprendimento supervisionato deve attraversare. Tuttavia, il compromesso è che anche valutare l’efficacia delle sue prestazioni è molto difficile. Al contrario, è molto facile misurare l’accuratezza degli algoritmi di apprendimento supervisionato confrontando il loro output con le etichette effettive dei loro dati di test.