Kategoorilised andmed vs arvandmed
Andmed on faktid või teave, mis on kogutud viitamiseks või analüüsimiseks. Sageli kogutakse neid andmeid asjaomase subjekti atribuudina. See atribuut võib varieeruda, mistõttu seda varieeruvat atribuuti võib pidada muutujaks. Muutujad võivad omandada erinevaid väärtuste vorme ja need on kogutud andmetes olemuslikud.
Muutujad võivad olla kas kvalitatiivsed või kvantitatiivsed; st kui muutuja on kvantitatiivne, on vastused arvud ja mõõdetud atribuudi suuruse saab teatava täpsusega öelda. Teist tüüpi, kvalitatiivsed muutujad mõõdavad kvalitatiivseid atribuute ja muutujate poolt eeldatavaid väärtusi ei saa anda suuruse ega suuruse järgi. Muutujaid ennast nimetatakse kategoorilisteks muutujateks ja kategoorilise muutuja abil kogutud andmed on kategoorilised andmed.
Lisateave arvandmete kohta
Numbrilised andmed on põhimõtteliselt muutujast saadud kvantitatiivsed andmed ja väärtusel on suurus / suurus. Saadud numbrilised andmed jagunevad Stanley Smith Stevensi välja töötatud teooria põhjal veel kolme kategooriasse. Numbrilised andmed võivad olla nii järjestused, intervallid kui ka suhtarvud. Andmete tüüp määratakse väärtuste mõõtmismeetodi abil ja tüübid on tuntud kui mõõtetasemed.
Inimese kaal, kahe punkti vaheline kaugus, temperatuur ja aktsia hind on arvandmete näited.
Statistikas tuletatakse enamik meetodeid arvandmete analüüsiks. Arvandmete analüüsimiseks kasutatakse peamiselt kirjeldavat statistikat ja regressiooni ning muid järeldusmeetodeid.
Lisateave kategooriliste andmete kohta
Kategoorilised andmed on kvalitatiivse muutuja väärtused, sageli arv, sõna või sümbol. Nad toovad välja asjaolu, et vaadeldaval juhul kuulub muutuja ühte paljudest saadaolevatest valikutest. Seetõttu kuuluvad nad ühte kategooriasse; siit ka nimi kategooriline.
Kvalitatiivsed omadused on inimese poliitiline kuuluvus, inimese rahvus, inimese lemmikvärv ja patsiendi veregrupp. Mõnikord võib arvu saada kategoorilise väärtusena, kuid number ise ei tähenda mõõdetud atribuudi suurust. Postiindeks on üks näide.
Samuti kuuluvad kõik kategoorilised väärtused nominaalsete andmetüüpide hulka, mis on mõõtmistasanditel põhinev teine tüüp. Kategooriliste andmete analüüsimiseks kasutatud meetodid erinevad arvandmete analüüsimeetoditest, kuid selle põhimõte võib olla sama.
Mis vahe on kategoorilistel ja arvandmetel?
• Numbrilised andmed on kvantitatiivse muutuja väärtused, millel on muutuja kontekstiga seotud suurusjärk (seega on need alati numbrilised väärtused või numbrid). Kategoorilised andmed on kvalitatiivse muutuja väärtused; kategoorilised andmenumbrid ei tähenda suurust.
• Numbrilised andmed kuuluvad alati järjestus-, suhe- või intervalltüüpi, kategoorilised andmed aga nominaaltüüpi.
• Kvantitatiivsete andmete analüüsimiseks kasutatud meetodid erinevad kategooriliste andmete puhul kasutatavatest meetoditest, isegi kui põhimõtted on samad, on rakendusel vähemalt olulisi erinevusi.
• Numbrilisi andmeid analüüsitakse statistiliste meetodite abil kirjeldavas statistikas, regressioonis, aegridades ja paljudes teistes.
• Kategooriliste andmete jaoks kasutatakse tavaliselt kirjeldavaid meetodeid ja graafilisi meetodeid. Kasutatakse ka mõnda mitteparameetrilist testi.