Peamine erinevus klastrite ja klassifikatsiooni vahel seisneb selles, et klasterdamine on järelevalveta õppetehnika, mis rühmitab sarnaseid eksemplare funktsioonide alusel, samas kui klassifitseerimine on juhendatud õppetehnika, mis määrab eksemplaridele tunnuste põhjal eelnevalt määratletud sildid.
Kuigi klasterdamine ja klassifitseerimine näivad olevat sarnased protsessid, on neil nende tähenduse põhjal erinevus. Andmekaevanduse maailmas on klastrid ja klassifitseerimine kahte tüüpi õppemeetodeid. Mõlemad meetodid iseloomustavad objekte rühmadeks ühe või mitme tunnuse järgi.
SISU
1. Ülevaade ja põhierinevus
2. Mis on klastreerimine
3. Mis on klassifikatsioon
4. Kõrvuti võrdlus - klastrite moodustamine vs tabelina klassifitseerimine
5. Kokkuvõte
Mis on klasterdamine?
Klasterdamine on meetod objektide rühmitamiseks selliselt, et sarnaste tunnustega objektid saavad kokku ja erinevad omadused eristuvad. See on masinõppe ja andmete kaevandamise statistiliste andmete analüüsi levinud tehnika. Uurimuslik andmete analüüs ja üldistamine on samuti valdkond, mis kasutab klastreid.
Joonis 01: klastrid
Klasterdamine kuulub järelevalveta andmekaevandusse. See ei ole üks konkreetne algoritm, kuid see on üldine meetod ülesande lahendamiseks. Seetõttu on erinevate algoritmide abil võimalik saavutada klasterdamine. Sobiv klastri algoritm ja parameetrite sätted sõltuvad üksikutest andmekogumitest. See ei ole automaatne ülesanne, kuid see on korduv avastamisprotsess. Seetõttu on vaja muuta andmetöötlust ja parameetrite modelleerimist, kuni tulemus saavutab soovitud omadused. K-tähendab klastreerimine ja hierarhiline klasterdamine on andmekaevanduses kaks levinumat klastrialgoritmi.
Mis on klassifikatsioon?
Klassifitseerimine on kategoriseerimisprotsess, mis kasutab objektide äratundmiseks, eristamiseks ja mõistmiseks õppekogumit. Klassifikatsioon on juhendatud õppetehnika, kus on olemas koolituskomplekt ja õigesti määratletud vaatlused.
Joonis 02: Klassifikatsioon
Klassifikatsiooni rakendav algoritm on klassifikaator, samas kui vaatlused on juhtumid. K-lähima naabri algoritm ja otsustuspuu algoritmid on andmekaevanduses kõige kuulsamad klassifitseerimisalgoritmid.
Mis on klastrite ja klassifikatsiooni erinevus?
Klasterdamine on järelevalveta õppimine, samas kui klassifitseerimine on juhendatud õppetehnika. See rühmitab sarnased eksemplarid funktsioonide alusel, samas kui klassifikatsioon määrab eksemplaridele funktsioonide põhjal eelnevalt määratletud sildid. Klasterdamine jagas andmekogumi alamhulkadeks, et grupeerida sarnaste funktsioonidega eksemplare. See ei kasuta sildistatud andmeid ega koolituskomplekti. Teiselt poolt kategoriseerige uued andmed vastavalt koolituskomplekti tähelepanekutele. Treeningukomplekt on sildistatud.
Klastrite eesmärk on rühmitada objektide komplekt, et leida, kas nende vahel on mingeid seoseid, klassifitseerimise eesmärk on aga leida, millisesse klassi uus objekt eelmääratud klasside hulgast kuulub.
Kokkuvõte - klasterdamine vs klassifikatsioon
Klasterdamine ja klassifitseerimine võivad tunduda sarnased, kuna mõlemad andmekaevamise algoritmid jagavad andmekogumi alamhulkadeks, kuid need on andmekaevanduses kaks erinevat õppimistehnikat, et saada algandmete kogust usaldusväärset teavet. Klastrite ja klassifikatsiooni erinevus seisneb selles, et klasterdamine on järelevalveta õppetehnika, mis rühmitab sarnaseid eksemplare tunnuste alusel, samas kui klassifitseerimine on juhendatud õppetehnika, mis määrab eksemplaridele tunnuste põhjal eelnevalt määratletud sildid.
Pildi viisakus:
1. Cluster-2 ″ autor Cluster-2.gif: hellispi tuletatud töö: (Avalik domeen) Wikimedia Commonsi kaudu 2. John Maggedsi „Magnetism” - Oma töö. (Avalik domeen) Wikimedia Commonsi kaudu