Peamine erinevus - juhendatud ja järelevalveta masinõpe
Juhendatud õppimine ja järelevalveta õppimine on masinõppe kaks põhimõistet. Juhendatud õpe on masinõppe ülesanne õppida funktsiooni, mis kaardistab sisendi väljundisse sisend-väljundpaari näidete põhjal. Järelevalveta õppimine on masinõppe ülesanne tuletada funktsioon, mis kirjeldab sildistamata andmetest peidetud struktuuri. Peamine erinevus juhendatava ja järelevalveta masinõppe vahel on see, et juhendatud õppes kasutatakse sildistatud andmeid, järelevalveta õppetöös aga sildistamata andmeid.
Masinõpe on arvutiteaduse valdkond, mis annab arvutisüsteemile võimaluse õppida andmetest ilma selgesõnaliselt programmeerimata. See võimaldab andmeid analüüsida ja nende mustreid ennustada. Masinõppe rakendusi on palju. Mõned neist on näotuvastus, žestide tuvastamine ja kõnetuvastus. Masinõppega on seotud erinevad algoritmid. Mõned neist on regressioon, klassifikatsioon ja klastrid. Masinõppepõhiste rakenduste arendamiseks on levinumad programmeerimiskeeled R ja Python. Kasutada saab ka muid keeli nagu Java, C ++ ja Matlab.
SISU
1. Ülevaade ja peamine erinevus
2. Mis on juhendatud õppimine
3. Mis on järelevalveta õppimine
4. Järelevalve all oleva ja järelevalveta masinõppe sarnasused
5. Kõrvuti võrdlus - juhendatud vs järelevalveta masinõpe tabelina
6. Kokkuvõte
Mis on juhendatud õppimine?
Masinõppepõhistes süsteemides töötab mudel algoritmi järgi. Juhendatud õppimisel juhendatakse mudelit. Esiteks on see vajalik mudeli koolitamiseks. Saadud teadmiste abil saab see ennustada vastuseid tulevastele juhtumitele. Mudelit koolitatakse sildistatud andmekogumi abil. Kui süsteemile antakse valimiandmeid, saab see tulemust ennustada. Järgneb väike väljavõte populaarsest IRIS-i andmestikust.
Ülaltoodud tabeli järgi nimetatakse atribuutideks septaali pikkust, tupsu laiust, pateli pikkust, pateli laiust ja liike. Veerud on tuntud kui funktsioonid. Ühes reas on andmed kõigi atribuutide kohta. Seetõttu nimetatakse ühte rida vaatluseks. Andmed võivad olla kas numbrilised või kategoorilised. Mudelile antakse vaatlused, mille sisendiks on vastav liiginimi. Uue vaatluse andmisel peaks mudel ennustama, millist tüüpi liiki ta kuulub.
Juhendatud õppes on klassifitseerimise ja regressiooni algoritmid. Klassifitseerimine on märgistatud andmete klassifitseerimise protsess. Mudel lõi piirid, mis eraldasid andmete kategooriad. Kui mudelile esitatakse uusi andmeid, saab see kategoriseerida selle järgi, kus punkt on olemas. K-lähimad naabrid (KNN) on klassifikatsioonimudel. Sõltuvalt k väärtusest otsustatakse kategooria. Näiteks kui k on 5 ja kui konkreetne andmepunkt on A kategooria kaheksa ja B kategooria kuue andmepunkti lähedal, liigitatakse andmepunkt A-ks.
Regressioon on protsess, millega ennustatakse varasemate andmete suundumust uute andmete tulemuse ennustamiseks. Regressioonis võib väljund koosneda ühest või mitmest pidevast muutujast. Ennustamiseks kasutatakse joont, mis hõlmab enamikku andmepunkte. Lihtsaim regressioonimudel on lineaarne regressioon. See on kiire ja ei vaja parameetrite häälestamist, näiteks KNN-is. Kui andmed näitavad paraboolset suundumust, siis lineaarse regressiooni mudel ei sobi.
Need on mõned näited juhendatud õppealgoritmidest. Üldiselt on juhendatud õppemeetodite tulemused täpsemad ja usaldusväärsemad, kuna sisendandmed on hästi teada ja sildistatud. Seetõttu peab masin analüüsima ainult varjatud mustreid.
Mis on järelevalveta õppimine?
Järelevalveta õppimisel mudeli üle järelevalvet ei tehta. Mudel töötab tulemuste ennustamiseks iseseisvalt. Märgistamata andmete kohta järelduste tegemiseks kasutab see masinõppe algoritme. Üldiselt on järelevalveta õpialgoritmid raskemad kui juhendatud õppealgoritmid, kuna teavet on vähe. Klasterdamine on järelevalveta õppimise tüüp. Seda saab kasutada tundmatute andmete rühmitamiseks algoritmide abil. K-keskmine ja tiheduspõhine klasterdamine on kaks klastrialgoritmi.
k-keskmine algoritm, paigutab k tsentroidi juhuslikult iga klastri jaoks. Seejärel määratakse iga andmepunkt lähimale tsentroidile. Eukleidese kauguse abil arvutatakse kaugus andmepunktist tsentroidini. Andmepunktid liigitatakse rühmadesse. K tsentriidide asukohad arvutatakse uuesti. Tsentroidi uue positsiooni määrab rühma kõigi punktide keskmine. Jällegi määratakse iga andmepunkt lähimale tsentroidile. See protsess kordub seni, kuni tsentriidid enam ei muutu. k-keskmine on kiire klastrite algoritm, kuid klastrite punktide täpsustatud initsialiseerimine puudub. Samuti on klastripunktide initsialiseerimisel põhinev klastrimudelite suur variatsioon.
Teine klastrialgoritm on Tihedusel põhinev klasterdamine. Seda tuntakse ka kui müra tiheduspõhiseid ruumiklastrite rakendusi. See töötab klastri määratlemisel tihedusega ühendatud punktide maksimaalse kogumina. Need on kaks parameetrit, mida kasutatakse tihedusel põhineva klastrite jaoks. Need on Ɛ (epsilon) ja minimaalsed punktid. Ɛ on naabruskonna maksimaalne raadius. Minimaalsed punktid on minimaalne punktide arv naabruses Ɛ klastri määratlemiseks. Need on mõned näited klasterdamisest, mis kuulub järelevalveta õppimise juurde.
Üldiselt pole järelevalveta õppimisalgoritmide abil saadud tulemused eriti täpsed ja usaldusväärsed, kuna masin peab enne peidetud mustrite ja funktsioonide määramist sisendandmed määratlema ja sildistama.
Milline on juhendatud ja järelevalveta masinõppe sarnasus?
Nii juhendatud kui ka järelevalveta õppimine on masinõppe tüübid
Mis vahe on juhendatud ja järelevalveta masinõppe vahel?
Erinev artikkel keskel enne tabelit
Juhendatud vs järelevalveta masinõpe |
|
Juhendatud õpe on masinõppe ülesanne õppida funktsiooni, mis kaardistab sisendi väljundisse sisend-väljundpaaride näidete põhjal. | Järelevalveta õppimine on masinõppe ülesanne tuletada funktsioon, mis kirjeldab sildistamata andmetest peidetud struktuuri. |
Peamine funktsionaalsus | |
Juhendatud õppes ennustab mudel tulemust sildistatud sisendandmete põhjal. | Järelevalveta õppimisel ennustab mudel tulemust ilma sildistatud andmeteta, tuvastades ise mustrid. |
Tulemuste täpsus | |
Juhendatud õppemeetoditest saadud tulemused on täpsemad ja usaldusväärsemad. | Järelevalveta jäetud õppemeetoditest saadud tulemused pole eriti täpsed ja usaldusväärsed. |
Peamised algoritmid | |
Juhendatud õppes on olemas regressiooni ja klassifitseerimise algoritmid. | Järelevalveta õppimisel on klastrite loomiseks algoritme. |
Kokkuvõte - juhendatud vs järelevalveta masinõpe
Juhendatud õppimine ja järelevalveta õppimine on kaks masinõppe tüüpi. Juhendatud õpe on masinõppe ülesanne õppida funktsiooni, mis kaardistab sisendi väljundisse sisend-väljundpaaride näidete põhjal. Järelevalveta õppimine on masinõppe ülesanne tuletada funktsioon, mis kirjeldab sildistamata andmetest peidetud struktuuri. Juhendatud ja järelevalveta masinõppe erinevus seisneb selles, et juhendatud õppimine kasutab sildistatud andmeid, järelevalveta kallutamine aga sildistamata andmeid.