types machine learning
Questo tutorial spiega i tipi di apprendimento automatico, ovvero l'apprendimento supervisionato, non supervisionato, di rinforzo e semi-supervisionato con semplici esempi. Imparerai anche le differenze tra l'apprendimento supervisionato e non supervisionato:
Nel Tutorial precedente , abbiamo imparato a conoscere l'apprendimento automatico, il suo funzionamento e le applicazioni. Abbiamo anche visto un confronto tra Machine Learning e Intelligenza Artificiale.
L'apprendimento automatico è un campo della scienza che si occupa di programmi per computer che apprendono attraverso l'esperienza e prevedono l'output.
La caratteristica principale del ML è imparare dall'esperienza. L'apprendimento avviene quando il sistema alimentato con i dati di input di addestramento apporta modifiche ai suoi parametri e si adegua per fornire l'output desiderato. L'output è il valore target definito nei dati di addestramento.
=> Leggi la serie completa di formazione sull'apprendimento automatico
Cosa imparerai:
- Tipi di machine learning
- Esempio reale di apprendimento supervisionato e non supervisionato
- Differenza tra apprendimento supervisionato e non supervisionato
- Apprendimento semi-supervisionato
- Conclusione
Tipi di machine learning
I programmi di machine learning sono classificati in 3 tipi come mostrato di seguito.
- Supervisionato
- Senza supervisione
- Insegnamento rafforzativo
Cerchiamo di capire ognuno di questi in dettaglio !!
# 1) Apprendimento supervisionato
L'apprendimento supervisionato avviene in presenza di un supervisore proprio come l'apprendimento eseguito da un bambino piccolo con l'aiuto del suo insegnante. Come un bambino viene addestrato a riconoscere frutti, colori, numeri sotto la supervisione di un insegnante, questo metodo è apprendimento supervisionato.
In questo metodo, ogni passo del bambino viene controllato dall'insegnante e il bambino impara dall'output che deve produrre.
Come funziona l'apprendimento supervisionato?
Nell'algoritmo ML supervisionato, l'output è già noto. C'è una mappatura dell'input con l'output. Quindi, per creare un modello, la macchina viene alimentata con molti dati di input di addestramento (con input e output corrispondente noti).
I dati di addestramento aiutano a raggiungere un livello di accuratezza per il modello di dati creato. Il modello costruito è ora pronto per essere alimentato con nuovi dati di input e prevedere i risultati.
Che cos'è un set di dati etichettato?
Il set di dati con output noti per un dato input è chiamato set di dati con etichetta. Per esempio, si conosce un'immagine di frutta insieme al nome della frutta. Quindi, quando viene mostrata una nuova immagine di frutta, viene confrontata con il set di allenamento per prevedere la risposta.
L'apprendimento supervisionato è un meccanismo di apprendimento rapido con elevata precisione. I problemi di apprendimento supervisionato includono problemi di regressione e classificazione.
Alcuni degli algoritmi di apprendimento supervisionato sono:
- Alberi decisionali,
- K-Vicino più vicino,
- Regressione lineare,
- Supporta Vector Machine e
- Reti neurali.
Esempio di apprendimento supervisionato
- Nella prima fase, un set di dati di addestramento viene inviato all'algoritmo di apprendimento automatico.
- Con il set di dati di addestramento, la macchina si regola da sola, apportando modifiche ai parametri per costruire un modello logico.
- Il modello costruito viene quindi utilizzato per una nuova serie di dati per prevedere il risultato.
Tipi di algoritmi di apprendimento supervisionato
- Classificazione: In questi tipi di problemi, prevediamo la risposta come classi specifiche, come 'sì' o 'no'. Quando sono presenti solo 2 classi, si parla di classificazione binaria. Per più di 2 valori di classe, viene chiamata classificazione multi-classe. I valori della risposta prevista sono valori discreti. Per esempio, È l'immagine del sole o della luna? L'algoritmo di classificazione separa i dati in classi.
- Regressione: I problemi di regressione prevedono la risposta come valori continui come la previsione di un valore che va da -infinito a infinito. Potrebbero essere necessari molti valori. Per esempio, l'algoritmo di regressione lineare che viene applicato, prevede il costo della casa in base a molti parametri come posizione, aeroporto vicino, dimensione della casa, ecc.
# 2) Apprendimento senza supervisione
L'apprendimento senza supervisione avviene senza l'aiuto di un supervisore proprio come un pesce impara a nuotare da solo. È un processo di apprendimento indipendente.
In questo modello, poiché non vi è alcun output mappato con l'input, i valori di destinazione sono sconosciuti / senza etichetta. Il sistema ha bisogno di apprendere da solo dall'input di dati e rilevare i modelli nascosti.
Che cos'è il set di dati senza etichetta?
Un dataset con valori di output sconosciuti per tutti i valori di input viene chiamato dataset senza etichetta.
Come funziona l'apprendimento senza supervisione?
Poiché non sono presenti valori di output noti che possono essere utilizzati per creare un modello logico tra input e output, alcune tecniche vengono utilizzate per estrarre regole, modelli e gruppi di dati con tipi simili. Questi gruppi aiutano gli utenti finali a comprendere meglio i dati e a trovare un output significativo.
Gli input forniti non hanno la forma di una struttura adeguata proprio come i dati di addestramento (nell'apprendimento supervisionato). Può contenere valori anomali, dati rumorosi, ecc. Questi input vengono inviati insieme al sistema. Durante l'addestramento del modello, gli input sono organizzati per formare cluster.
Gli algoritmi di apprendimento senza supervisione includono algoritmi di clustering e di associazione come:
- A priori,
- K-significa clustering e altri algoritmi di mining di regole di associazione.
Quando nuovi dati vengono forniti al modello, predice il risultato come un'etichetta di classe a cui appartiene l'input. Se l'etichetta della classe non è presente, verrà generata una nuova classe.
Durante il processo di scoperta dei modelli nei dati, il modello regola i suoi parametri da solo, quindi è anche chiamato auto-organizzazione. I cluster saranno formati scoprendo le somiglianze tra gli input.
Per esempio, durante l'acquisto di prodotti online, se il burro viene inserito nel carrello, suggerisce di acquistare pane, formaggio, ecc. Il modello non supervisionato esamina i punti dati e prevede gli altri attributi associati al prodotto.
Esempio di apprendimento senza supervisione
Tipi di algoritmi non supervisionati
- Algoritmo di clustering : I metodi per trovare le somiglianze tra elementi di dati come la stessa forma, dimensione, colore, prezzo, ecc. E raggrupparli per formare un cluster è l'analisi dei cluster.
- Rilevamento dei valori anomali : In questo metodo, il set di dati è la ricerca di qualsiasi tipo di dissomiglianze e anomalie nei dati. Per esempio, una transazione di alto valore su carta di credito viene rilevata dal sistema per il rilevamento delle frodi.
- Mining delle regole di associazione : In questo tipo di mining, rileva i set di elementi o le associazioni tra gli elementi che si verificano più di frequente. Associazioni come 'prodotti acquistati spesso insieme', ecc.
- Codificatori automatici: L'input viene compresso in una forma codificata e viene ricreato per rimuovere i dati rumorosi. Questa tecnica viene utilizzata per migliorare la qualità dell'immagine e del video.
# 3) Apprendimento per rinforzo
In questo tipo di apprendimento, l'algoritmo apprende tramite il meccanismo di feedback e le esperienze passate. È sempre auspicabile che ogni passaggio dell'algoritmo venga eseguito per raggiungere un obiettivo.
Pertanto, ogni volta che deve essere intrapreso il passaggio successivo, riceve il feedback dal passaggio precedente, insieme all'apprendimento dall'esperienza per prevedere quale potrebbe essere il passaggio migliore successivo. Questo processo è anche chiamato processo per tentativi ed errori per raggiungere l'obiettivo.
L'apprendimento per rinforzo è un processo iterativo a lungo termine. Maggiore è il numero di feedback, più preciso diventa il sistema. L'apprendimento per rinforzo di base è anche chiamato processo decisionale di Markov.
Esempio di apprendimento per rinforzo
Un esempio di apprendimento per rinforzo sono i videogiochi, in cui i giocatori completano determinati livelli di un gioco e guadagnano punti premio. Il gioco fornisce feedback al giocatore attraverso mosse bonus per migliorare le sue prestazioni.
L'apprendimento per rinforzo viene utilizzato per addestrare robot, auto a guida autonoma, gestione automatica dell'inventario, ecc.
Alcuni algoritmi popolari di Reinforcement Learning includono:
- Q-Learning,
- Deep Adversarial Networks
- Differenza temporale
La figura seguente descrive il meccanismo di feedback del Reinforcement Learning.
- L'input è osservato dall'agente che è l'elemento AI.
- Questo agente AI agisce sull'ambiente in base alla decisione presa.
- La risposta dell'ambiente viene inviata all'IA sotto forma di ricompensa come feedback.
- Vengono salvati anche lo stato e le azioni eseguite sull'ambiente.
[Immagine fonte ]
Esempio reale di apprendimento supervisionato e non supervisionato
Per l'apprendimento supervisionato:
# 1) Facciamo un esempio di un cesto di verdure con cipolla, carota, ravanello, pomodoro, ecc., E possiamo disporli in forma di gruppi.
#Due) Creiamo una tabella dei dati di formazione per comprendere l'apprendimento supervisionato.
La tabella dei dati di allenamento caratterizza le verdure in base a:
- Forma
- Colore
- Taglia
Forma | Colore | Taglia | Verdura |
---|---|---|---|
È più accurato dell'apprendimento senza supervisione poiché i dati di input e l'output corrispondente sono ben noti e la macchina deve solo fornire previsioni. | Ha meno precisione in quanto i dati di input non sono etichettati. Quindi la macchina deve prima capire ed etichettare i dati e poi fornire previsioni. | ||
Il giro | Marrone | Grande | Cipolla |
Il giro | Netto | medio | Pomodoro |
Cilindrico | bianca | Grande | Ravanello |
Cilindrico | Netto | medio | Carota |
Quando questa tabella dei dati di addestramento viene fornita alla macchina, costruirà un modello logico utilizzando la forma, il colore, la dimensione della verdura, ecc., Per prevedere il risultato (verdura).
miglior antivirus con VPN
Quando un nuovo input viene fornito a questo modello, l'algoritmo analizzerà i parametri e restituirà il nome del frutto.
Per l'apprendimento senza supervisione:
Nell'apprendimento senza supervisione, crea gruppi o cluster in base agli attributi. Nel set di dati di esempio sopra, i parametri della verdura sono:
# 1) Forma
Le verdure vengono raggruppate in base alla forma.
- Il giro: Cipolla e Pomodoro.
- Cilindrico: Ravanello e Carota.
Prendi un altro parametro come la dimensione.
# 2) Dimensioni
Le verdure sono raggruppate in base alla dimensione e alla forma:
- Di medie dimensioni e forma rotonda: Pomodoro
- Grandi dimensioni e forma rotonda: Cipolla
Nell'apprendimento non supervisionato, non abbiamo alcun set di dati di addestramento e variabile di risultato mentre nell'apprendimento supervisionato, i dati di addestramento sono noti e vengono utilizzati per addestrare l'algoritmo.
Differenza tra apprendimento supervisionato e non supervisionato
Supervisionato | Senza supervisione |
---|---|
Negli algoritmi di apprendimento supervisionato, l'output per l'input dato è noto. | Negli algoritmi di apprendimento senza supervisione, l'output per l'input specificato è sconosciuto. |
Gli algoritmi apprendono da un insieme di dati etichettato. Questi dati aiutano a valutare l'accuratezza dei dati di addestramento. | L'algoritmo viene fornito con dati senza etichetta in cui cerca di trovare modelli e associazioni tra gli elementi di dati. |
È una tecnica di modellazione predittiva che predice accuratamente i risultati futuri. | È una tecnica di modellazione descrittiva che spiega la relazione reale tra gli elementi e la storia degli elementi. |
Include algoritmi di classificazione e regressione. | Include algoritmi di apprendimento delle regole di clustering e associazione. |
Alcuni algoritmi di apprendimento supervisionato sono regressione lineare, Naïve Bayes e reti neurali. | Alcuni algoritmi per l'apprendimento senza supervisione sono k- significa clustering, Apriori, ecc. |
Questo tipo di apprendimento è relativamente complesso in quanto richiede dati etichettati. | È meno complesso in quanto non è necessario comprendere ed etichettare i dati. |
È un processo online di analisi dei dati e non richiede l'interazione umana. | Questa è un'analisi dei dati in tempo reale. |
Apprendimento semi-supervisionato
L'approccio di apprendimento semi-supervisionato richiede input di dati di formazione sia etichettati che non etichettati. Questo tipo di apprendimento è utile quando è difficile estrarre funzioni utili da dati non etichettati (approccio supervisionato) e gli esperti di dati trovano difficile etichettare i dati di input (approccio non supervisionato).
Solo una piccola quantità di dati etichettati in questi algoritmi può portare alla precisione del modello.
Esempi dell'apprendimento semi-supervisionato includono scansioni TC e MRI in cui un esperto medico può etichettare alcuni punti nelle scansioni per qualsiasi malattia mentre è difficile etichettare tutte le scansioni.
Conclusione
Le attività di machine learning sono generalmente classificate in attività supervisionate, non supervisionate, semi-supervisionate e di apprendimento per rinforzo.
L'apprendimento supervisionato è l'apprendimento con l'aiuto di dati etichettati. Gli algoritmi ML vengono alimentati con un set di dati di addestramento in cui per ogni dato di input è noto l'output, per prevedere i risultati futuri.
Questo modello è estremamente preciso e veloce, ma richiede tempo e competenze elevate per essere costruito. Inoltre, questi modelli richiedono la ricostruzione se i dati cambiano. Le attività di ML come la regressione e la classificazione vengono eseguite in un ambiente di apprendimento supervisionato.
L'apprendimento senza supervisione avviene senza l'aiuto di un supervisore. I dati di input forniti agli algoritmi ML non sono etichettati, ovvero per ogni input non è noto alcun output. L'algoritmo individua da solo le tendenze e il modello nei dati di input e crea un'associazione tra i diversi attributi dell'input.
Questo tipo di apprendimento è utile per trovare modelli nei dati, creare gruppi di dati e analisi in tempo reale. Compiti come il clustering, gli algoritmi KNN, ecc. Rientrano nell'apprendimento non supervisionato.
Attività di apprendimento semi-supervisionato il vantaggio degli algoritmi supervisionati e non supervisionati prevedendo i risultati utilizzando dati etichettati e non etichettati. L'apprendimento per rinforzo è un tipo di meccanismo di feedback in cui la macchina apprende da un feedback costante dall'ambiente per raggiungere il suo obiettivo.
In questo tipo di apprendimento, gli agenti di intelligenza artificiale eseguono alcune azioni sui dati e l'ambiente dà una ricompensa. L'apprendimento per rinforzo viene utilizzato da giochi multiplayer per bambini, auto a guida autonoma, ecc.
Resta sintonizzato sul nostro prossimo tutorial per saperne di più sull'apprendimento automatico e sulla rete neurale artificiale!
=> Visita qui per l'esclusiva serie di machine learning
Lettura consigliata
- Data mining vs machine learning vs intelligenza artificiale vs deep learning
- 11 strumenti software di machine learning più popolari nel 2021
- Tutorial sull'apprendimento automatico: introduzione al machine learning e alle sue applicazioni
- Tipi di dati Python
- Tipi di dati C ++
- Tipi di rischi nei progetti software
- Tipi di test di migrazione: con scenari di test per ogni tipo
- 15 migliori sistemi di gestione dell'apprendimento (LMS dell'anno 2021)