Regressioon vs korrelatsioon
Statistikas on kahe juhusliku muutuja vahelise seose määramine oluline. See annab võimaluse ennustada ühe muutuja kohta teiste suhtes. Regressioonianalüüsi ja korrelatsiooni rakendatakse ilmaennustustes, finantsturu käitumises, füüsiliste suhete loomisel eksperimentide abil ja palju reaalsemates stsenaariumides.
Mis on regressioon?
Regressioon on statistiline meetod, mida kasutatakse kahe muutuja vahelise seose joonistamiseks. Sageli võib andmete kogumisel olla muutujaid, mis sõltuvad teistest. Täpse seose nende muutujate vahel saab kindlaks teha ainult regressioonimeetoditega. Selle seose kindlakstegemine aitab mõista ja ennustada ühe muutuja käitumist teisele.
Regressioonanalüüsi kõige tavalisem rakendus on sõltuva muutuja antud väärtuse või väärtuste vahemiku sõltuva muutuja väärtuse hindamine. Näiteks regressiooni abil saame juhusliku valimi põhjal kogutud andmete põhjal kindlaks teha kauba hinna ja tarbimise vahelise seose. Regressioonanalüüs loob andmekogumi regressioonifunktsiooni, mis on matemaatiline mudel, mis sobib kõige paremini saadaolevate andmetega. Seda saab hõlpsasti kujutada hajutamise graafikuna. Graafiliselt on regressioon samaväärne andmekogumi jaoks sobivaima kõvera leidmisega. Kõvera funktsioon on regressioonifunktsioon. Matemaatilise mudeli abil saab kauba nõudlust antud hinna järgi ennustada.
Seetõttu kasutatakse regressioonianalüüsi ennustamisel ja prognoosimisel laialdaselt. Seda kasutatakse ka seoste loomiseks eksperimentaalsetes andmetes, füüsika, keemia ning paljude loodusteaduste ja inseneridistsipliinide valdkonnas. Kui seos või regressioonifunktsioon on lineaarne funktsioon, siis on protsess tuntud kui lineaarne regressioon. Hajusdiagrammil saab seda kujutada sirgjoonena. Kui funktsioon ei ole parameetrite lineaarne kombinatsioon, siis on regressioon mittelineaarne.
Mis on korrelatsioon?
Korrelatsioon on kahe muutuja vahelise suhte tugevuse mõõt. Korrelatsioonikordaja kvantifitseerib ühe muutuja muutusastme, lähtudes teise muutuja muutusest. Statistikas on korrelatsioon seotud sõltuvuse mõistega, mis on kahe muutuja statistiline seos.
Pearsonsi korrelatsioonikordaja või lihtsalt korrelatsioonikordaja r on väärtus vahemikus -1 kuni 1 (-1≤r≤ + 1). See on kõige sagedamini kasutatav korrelatsioonikordaja ja kehtib ainult muutujate vahelise lineaarse seose korral. Kui r = 0, pole seost olemas ja kui r ≥0, on seos otseselt proportsionaalne; st ühe muutuja väärtus suureneb teise suurenedes. Kui r≤0, on seos pöördvõrdeline; st üks muutuja väheneb teise kasvades.
Lineaarsuse tingimuse tõttu saab muutujate vahelise lineaarse seose tuvastamiseks kasutada ka korrelatsioonikordajat r.
Mis vahe on regressioonil ja korrelatsioonil?
Regressioon annab kahe juhusliku muutuja vahelise suhte vormi ja korrelatsioon annab seose tugevusastme.
Regressioonanalüüs annab regressioonifunktsiooni, mis aitab tulemusi ekstrapoleerida ja ennustada, samas kui korrelatsioon võib anda teavet ainult selles suunas, mida see võib muuta.
Täpsemad lineaarse regressiooni mudelid antakse analüüsiga, kui korrelatsioonikordaja on suurem. (| r | ≥0,8)