types machine learning
V tomto výučbe sú na jednoduchých príkladoch vysvetlené typy strojového učenia, t. J. Supervidované, nekontrolované, vystužovacie a čiastočne supervidované vzdelávanie. Dozviete sa tiež rozdiely medzi učením bez dozoru:
V Predchádzajúci návod , dozvedeli sme sa o Machine Learning, jeho fungovaní a aplikáciách. Videli sme tiež porovnanie umelej inteligencie Machine Learning vs.
Machine Learning je prírodovedná oblasť, ktorá sa zaoberá výučbou počítačových programov pomocou skúseností a predpovedaním výstupov.
Hlavnou črtou ML je učenie sa zo skúseností. K učeniu dôjde, keď systém napájaný vstupnými dátami tréningu urobí zmeny vo svojich parametroch a upraví sa tak, aby poskytol požadovaný výstup. Výstupom je cieľová hodnota definovaná v tréningových dátach.
=> Prečítajte si celú sériu školení o strojovom učení
Čo sa dozviete:
- Typy strojového učenia
- Príklad reálneho a supervidovaného učenia sa v reálnom živote
- Rozdiel medzi učením bez dozoru
- Učenie s čiastočným dohľadom
- Záver
Typy strojového učenia
Programy strojového učenia sú rozdelené do 3 typov, ako je uvedené nižšie.
- Pod dozorom
- Bez dozoru
- Výučba posilňovania
Poďme každému z nich podrobne porozumieť !!
# 1) Učenie pod dohľadom
Učenie pod dohľadom sa deje za prítomnosti školiteľa, rovnako ako učenie sa malého dieťaťa s pomocou jeho učiteľa. Keď je dieťa trénované na rozpoznávanie ovocia, farieb, čísel pod dohľadom učiteľa, táto metóda je pod dohľadom učiteľa.
Pri tejto metóde učiteľ kontroluje každý krok dieťaťa a dieťa sa učí z výstupu, ktorý má vyprodukovať.
Ako funguje kontrolované učenie?
V supervidovanom algoritme ML je výstup už známy. Existuje mapovanie vstupu s výstupom. Preto na vytvorenie modelu je stroj napájaný množstvom cvičných vstupných údajov (majúcich známy vstup a zodpovedajúci výstup).
Tréningové údaje pomáhajú dosiahnuť úroveň presnosti vytvoreného dátového modelu. Vytvorený model je teraz pripravený na napájanie novými vstupnými údajmi a predpovedanie výsledkov.
Čo je to označený súbor údajov?
Dataset s výstupmi známymi pre daný vstup sa nazýva označený dataset. Napríklad, je známy obrázok ovocia spolu s názvom ovocia. Takže keď sa ukáže nový obraz ovocia, porovná sa s tréningovou sadou na predpovedanie odpovede.
Kontrolované učenie je mechanizmus rýchleho učenia s vysokou presnosťou. Medzi kontrolované problémy s učením patria regresné a klasifikačné problémy.
Niektoré z kontrolovaných učebných algoritmov sú:
- Rozhodovacie stromy,
- K-najbližší sused,
- Lineárna regresia,
- Podpora Vector Machine a
- Neurálne siete.
Príklad supervidovaného učenia
- V prvom kroku sa tréningová dátová sada privádza do algoritmu strojového učenia.
- So súborom tréningových údajov sa stroj sám upraví vykonaním zmien v parametroch a vytvorením logického modelu.
- Vytvorený model sa potom použije pre novú množinu údajov na predpovedanie výsledku.
Typy algoritmov učeného pod dohľadom
- Klasifikácia: Pri týchto typoch problémov predpovedáme reakciu ako konkrétne triedy, napríklad „áno“ alebo „nie“. Ak sú prítomné iba 2 triedy, nazýva sa to Binárna klasifikácia. Pre viac ako 2 hodnoty tried sa nazýva viactriedna klasifikácia. Predpovedané hodnoty odozvy sú diskrétne hodnoty. Napríklad, Je to obraz slnka alebo mesiaca? Klasifikačný algoritmus rozdeľuje údaje do tried.
- Regresia: Problémy s regresiou predpovedajú reakciu ako spojité hodnoty, napríklad ako predikcia hodnoty, ktorá sa pohybuje od-nekonečna do nekonečna. Môže to mať veľa hodnôt. Napríklad, algoritmus lineárnej regresie, ktorý sa používa, predpovedá náklady na dom na základe mnohých parametrov, ako je poloha, blízke letisko, veľkosť domu atď.
# 2) Učenie bez dozoru
K učeniu bez dozoru dochádza bez pomoci nadriadeného, rovnako ako sa ryba sama naučí plávať. Je to nezávislý proces učenia.
Pretože v tomto modeli nie je žiadny výstup mapovaný so vstupom, cieľové hodnoty sú neznáme / neoznačené. Systém sa musí sám učiť zo vstupu údajov a zistiť skryté vzory.
Čo je datová sada bez označenia?
bublinové triedenie poľa c ++
Množina údajov s neznámymi výstupnými hodnotami pre všetky vstupné hodnoty sa nazýva neoznačená množina údajov.
Ako funguje učenie bez dozoru?
Pretože nie sú známe žiadne výstupné hodnoty, ktoré by sa dali použiť na zostavenie logického modelu medzi vstupom a výstupom, používajú sa niektoré techniky na ťažbu dátových pravidiel, vzorov a skupín údajov s podobnými typmi. Tieto skupiny pomáhajú koncovým používateľom lepšie porozumieť údajom a nájsť zmysluplný výstup.
Nasýtené vstupy nemajú formu správnej štruktúry, podobne ako sú údaje o tréningu (v učení pod dohľadom). Môže obsahovať mimoriadne hodnoty, hlučné údaje atď. Tieto vstupy sa spoločne napájajú do systému. Pri nácviku modelu sú vstupy organizované do klastrov.
Medzi neohraničené výukové algoritmy patria klastrové a asociačné algoritmy, ako napríklad:
- Apriori,
- K znamená zhlukovanie a ďalšie algoritmy ťažby asociačných pravidiel.
Keď sa do modelu zavedú nové údaje, bude predpovedať výsledok ako štítok triedy, ku ktorému vstup patrí. Ak štítok triedy nie je k dispozícii, vygeneruje sa nová trieda.
Počas procesu zisťovania vzorcov v údajoch model sám upravuje svoje parametre, preto sa mu hovorí aj samoorganizácia. Klastre budú tvorené zisťovaním podobností medzi vstupmi.
Napríklad, pri nákupe výrobkov online, ak je do košíka vložené maslo, potom sa navrhuje nákup chleba, syra atď. Model bez kontroly sa pozerá na údajové body a predpovedá ďalšie atribúty spojené s výrobkom.
Príklad učenia bez dozoru
Typy nekontrolovaných algoritmov
- Klastrový algoritmus : Metódy hľadania podobností medzi dátovými položkami, ako sú rovnaký tvar, veľkosť, farba, cena atď., A ich zoskupenie do podoby klastra, je klastrová analýza.
- Detekcia odľahlej hodnoty : V tejto metóde je dátový súbor hľadaním akýchkoľvek druhov odlišností a anomálií v dátach. Napríklad, transakcia s vysokou hodnotou na kreditnej karte je detekovaná systémom na detekciu podvodov.
- Ťažba združených pravidiel : Pri tomto type ťažby zisťuje najčastejšie sa vyskytujúce množiny položiek alebo asociácie medzi prvkami. Asociácie ako „výrobky často zakúpené spoločne“ atď.
- Automatické kódovače: Vstup je komprimovaný do kódovanej formy a je znovu vytvorený na odstránenie hlučných údajov. Táto technika sa používa na zlepšenie kvality obrazu a videa.
# 3) Učenie sa o posilňovaní
Pri tomto type učenia sa algoritmus učí mechanizmom spätnej väzby a minulými skúsenosťami. Vždy je žiaduce, aby sa každý krok v algoritme uskutočňoval na dosiahnutie cieľa.
Takže vždy, keď sa má podniknúť ďalší krok, dostane spätnú väzbu z predchádzajúceho kroku spolu s poučením zo skúsenosti, aby predpovedal, čo by mohlo byť ďalším najlepším krokom. Tento proces sa tiež nazýva pokus a omyl, ktorým sa dosiahne cieľ.
Posilňovanie je dlhodobý iteračný proces. Čím je počet spätných väzieb väčší, tým je systém presnejší. Základné posilňovacie učenie sa nazýva aj Markovov rozhodovací proces.
Ukážka posilňovacieho učenia
Príkladom Reinforcement Learning sú videohry, kde hráči absolvujú určité úrovne hry a získavajú body odmeny. Hra poskytuje hráčovi spätnú väzbu prostredníctvom bonusových pohybov, ktoré zlepšujú jeho výkon.
Reinforcement Learning sa používa pri výcviku robotov, automobilov s vlastným pohonom, automatickej správy zásob atď.
Niektoré populárne algoritmy Reinforcement Learning zahŕňajú:
- Q-učenie,
- Deep Adversarial Networks
- Časový rozdiel
Nasledujúci obrázok popisuje mechanizmus spätnej väzby Reinforcement Learning.
- Vstup sleduje agent, ktorým je prvok AI.
- Tento agent AI pôsobí na životné prostredie podľa rozhodnutia.
- Odozva prostredia sa do AI odošle vo forme odmeny späť ako spätná väzba.
- Stav a akcia vykonaná v životnom prostredí sa tiež uložia.
(obrázok zdroj )
Príklad reálneho a supervidovaného učenia sa v reálnom živote
Pre supervidované vzdelávanie:
# 1) Vezmime si napríklad košík so zeleninou, ktorý má cibuľu, mrkvu, reďkovku, paradajku atď., A môžeme ich usporiadať do skupín.
#dva) Vytvárame tabuľku tréningových údajov, aby sme porozumeli supervidovanému učeniu.
Tabuľka tréningových údajov charakterizuje zeleninu na základe:
- Tvar
- Farba
- Veľkosť
Tvar | Farba | Veľkosť | Zeleninové |
---|---|---|---|
Je to presnejšie ako učenie bez dozoru, pretože vstupné údaje a zodpovedajúci výstup sú dobre známe a stroj musí poskytovať iba predpovede. | Má menšiu presnosť, pretože vstupné údaje sú neoznačené. Preto musí stroj najskôr porozumieť a označiť údaje a potom poskytnúť predpovede. | ||
Okrúhly | Hnedá | Veľký | Cibuľa |
Okrúhly | Netto | Stredná | Paradajka |
Valcovitý | biely | Veľký | Reďkovka |
Valcovitý | Netto | Stredná | Mrkva |
Keď sa táto tabuľka s údajmi o tréningu privedie do stroja, vytvorí logický model pomocou tvaru, farby, veľkosti zeleniny atď., Aby predpovedal výsledok (zelenina).
Keď sa do tohto modelu zavedie nový vstup, algoritmus analyzuje parametre a vydá názov ovocia.
Pre učenie bez dozoru:
Pri učení bez dozoru vytvára skupiny alebo zoskupenia na základe atribútov. Vo vyššie uvedenom vzorovom súbore údajov sú parametre zeleniny:
# 1) Tvar
Zelenina je zoskupená podľa tvaru.
- Okrúhly: Cibuľa a paradajka.
- Valcový: Reďkovka a mrkva.
Vezmite iný parameter, napríklad veľkosť.
# 2) Veľkosť
Zelenina je zoskupená podľa veľkosti a tvaru:
- Stredná veľkosť a okrúhly tvar: Paradajka
- Veľká veľkosť a okrúhly tvar: Cibuľa
Pri učení bez dozoru nemáme žiadny tréningový údajový súbor a výstupnú premennú, zatiaľ čo pri učení pod dohľadom sú údaje o tréningu známe a používajú sa na trénovanie algoritmu.
Rozdiel medzi učením bez dozoru
Pod dozorom | Bez dozoru |
---|---|
V kontrolovaných učebných algoritmoch je výstup pre daný vstup známy. | V algoritmoch učenia bez dozoru je výstup pre daný vstup neznámy. |
Algoritmy sa učia z označenej množiny údajov. Tieto údaje pomáhajú pri hodnotení presnosti tréningových údajov. | Algoritmus je poskytnutý s neoznačenými údajmi, kde sa pokúša nájsť vzory a asociácie medzi dátovými položkami. |
Jedná sa o techniku prediktívneho modelovania, ktorá presne predpovedá budúce výsledky. | Jedná sa o techniku deskriptívneho modelovania, ktorá vysvetľuje skutočný vzťah medzi prvkami a históriou prvkov. |
Zahŕňa klasifikačné a regresné algoritmy. | Zahŕňa algoritmy učenia sa klastrových a asociačných pravidiel. |
Niektoré algoritmy učenia pod dohľadom sú Linear Regression, Naïve Bayes a Neural Networks. | Niektoré algoritmy pre učenie bez dozoru sú k- znamená zhlukovanie, Apriori atď. |
Tento typ učenia je pomerne zložitý, pretože vyžaduje údaje označené údajmi. | Je to menej zložité, pretože nie je potrebné porozumieť a označiť údaje. |
Je to online proces analýzy údajov a nevyžaduje ľudskú interakciu. | Toto je analýza dát v reálnom čase. |
Učenie s čiastočným dohľadom
Prístup k výučbe s čiastočným dohľadom vyžaduje vstupné aj neoznačené údaje o tréningu. Tento typ výučby je užitočný, keď je ťažké extrahovať užitočné vlastnosti z neoznačených údajov (prístup pod dohľadom) a odborníci na údaje považujú za ťažké označiť vstupné údaje (prístup bez dohľadu).
Iba malé množstvo označených údajov v týchto algoritmoch môže viesť k presnosti modelu.
Príklady Medzi výučby s čiastočným dohľadom patria CT snímky a MRI, pri ktorých môže lekársky odborník označiť niekoľko bodov v skene akejkoľvek choroby, zatiaľ čo je ťažké označiť všetky skeny.
Záver
Úlohy strojového učenia sa všeobecne delia na úlohy s dohľadom, bez dozoru, s polovičným dohľadom a na účely posilnenia učenia.
Kontrolované učenie je učenie pomocou označených údajov. Algoritmy ML sú napájané tréningovou dátovou sadou, v ktorej je pre každé vstupné dáta známy výstup, aby bolo možné predpovedať budúce výsledky.
Tento model je vysoko presný a rýchly, ale vyžaduje si vysokú odbornosť a čas na jeho zostavenie. Tieto modely tiež vyžadujú opätovné zostavenie, ak sa údaje zmenia. Úlohy ML, ako je regresia a klasifikácia, sa vykonávajú v učebnom prostredí pod dohľadom.
Výučba bez dozoru prebieha bez pomoci nadriadeného. Vstupné dáta privádzané do ML algoritmov sú neoznačené, to znamená, že pre každý vstup nie je známy žiadny výstup. Algoritmus sám zistí trendy a vzory vo vstupných dátach a vytvorí asociáciu medzi rôznymi atribútmi vstupu.
Tento typ učenia je užitočný na hľadanie vzorov v dátach, vytváranie zhlukov údajov a analýzu v reálnom čase. Úlohy ako klastrovanie, algoritmy KNN atď. Prechádzajú dohľadom bez dozoru.
Čiastočne kontrolované výukové úlohy majú výhodu algoritmov pod dohľadom aj bez dozoru, pretože predpovedajú výsledky pomocou označených aj neznačených údajov. Výstužné učenie je typ spätnoväzbového mechanizmu, pri ktorom sa stroj na dosiahnutie svojho cieľa učí z neustálej spätnej väzby z prostredia.
Pri tomto type učenia agenti AI vykonávajú niektoré akcie s údajmi a prostredie poskytuje odmenu. Posilnenie učenia využívajú hry pre viac hráčov pre deti, autá s vlastným riadením atď.
Zostaňte naladení na náš nadchádzajúci tutoriál a dozviete sa viac o strojovom učení a umelej neurónovej sieti!
=> Navštívte tu exkluzívnu sériu strojového učenia
Odporúčané čítanie
- Data Mining vs. Machine Learning vs. Artificial Intelligence vs. Deep Learning
- 11 najpopulárnejších softvérových nástrojov pre strojové učenie v roku 2021
- Výukový program pre strojové učenie: Úvod do ML a jeho aplikácií
- Dátové typy v Pythone
- Dátové typy C ++
- Typy rizík v softvérových projektoch
- Typy testovania migrácie: S testovacími scenármi pre každý typ
- 15 najlepších systémov riadenia výučby (LMS roku 2021)