Nustatykite koreliacijos koeficientą

Autorius: Morris Wright
Kūrybos Data: 28 Balandis 2021
Atnaujinimo Data: 19 Birželio Birželio Mėn 2024
Anonim
Correlation Coefficient
Video.: Correlation Coefficient

Turinys

Koreliacijos koeficientas, žymimas r arba ρ, yra linijinės koreliacijos (stiprio ir krypties santykio) tarp dviejų kintamųjų matas. Ji svyruoja nuo -1 iki +1, teigiamai ir neigiamai koreliacijai atspindėti naudojant pliuso ir minuso ženklus. Jei koreliacijos koeficientas yra lygiai -1, tada santykis tarp dviejų kintamųjų yra visiškai neigiamas; jei koreliacijos koeficientas yra lygiai +1, tai santykis yra visiškai teigiamas. Du kintamieji gali turėti teigiamą koreliaciją, neigiamą koreliaciją arba visiškai nesusiję. Koreliaciją galite apskaičiuoti rankiniu būdu, naudodamiesi kai kuriais nemokamais koreliacijos skaičiavimais, esančiais internete, arba naudodamiesi gero grafikų skaičiuoklės statistinėmis funkcijomis.

Žengti

1 metodas iš 4: apskaičiuokite koreliacijos koeficientą ranka

  1. Pirmiausia surinkite savo duomenis. Norėdami pradėti skaičiuoti efektyvią koreliaciją, pirmiausia ištirkite duomenų poras. Naudinga juos dėti į lentelę tiek vertikaliai, tiek horizontaliai. Pažymėkite kiekvieną eilutę arba stulpelį x ir y.
    • Pvz., Tarkime, kad turite keturias duomenų poras X ir y. Tada lentelė gali atrodyti taip:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Apskaičiuokite vidurkį X. Norėdami apskaičiuoti vidurkį, jums reikia visų reikšmių X pridėkite ir padalykite iš reikšmių skaičiaus.
    • Naudodamiesi anksčiau pateiktu pavyzdžiu, atkreipkite dėmesį, kad turite keturias reikšmes X. Norėdami apskaičiuoti vidurkį, susumuosite visas reikšmes X ir padalykite jį iš 4. Skaičiavimas atrodo taip:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Raskite vidurkį y. Į vidurkį y Norėdami jį rasti, atlikite tuos pačius veiksmus, sudėkite visas y reikšmes ir padalykite iš reikšmių skaičiaus.
      • Ankstesniame pavyzdyje taip pat turite keturias reikšmes y. Sudėkite visas šias vertes ir padalykite jas iš 4. Skaičiavimai atrodys taip:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Nustatykite standartinį nuokrypį X. Turėdami savo galimybes, galite apskaičiuoti standartinį nuokrypį. Norėdami tai padaryti, naudokite formulę:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Apskaičiuokite standartinį nuokrypį y. Atlikdami tuos pačius pagrindinius veiksmus, raskite standartinį nuokrypį y. Jūs naudosite tą pačią formulę, naudodami y duomenų taškus.
          • Turėdami pavyzdinius duomenis, skaičiavimai atrodys taip:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5–4) ^ {2} + (7–4) ^ {2})}}}Peržiūrėkite pagrindinę formulę koreliacijos koeficientui nustatyti. Koreliacijos koeficiento apskaičiavimo formulėje naudojamos priemonės, standartiniai nuokrypiai ir porų skaičius duomenų rinkinyje (pavaizduotas n). Pats koreliacijos koeficientas pateikiamas mažąja raide r arba graikiška raide ρ (rho). Šiame straipsnyje naudosime formulę, vadinamą Pearsono koreliacijos koeficientu, kaip parodyta žemiau:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = kairė ({ frac {1} {n-1}} dešinė) Sigma kairė ({ frac {x- mu _ {x}} { sigma _ {x}} } dešinė) * kairė ({ frac {y- mu _ {y}} { sigma _ {y}}} dešinė)}Nustatykite koreliacijos koeficientą. Dabar jūs turite kintamųjų vidurkius ir standartinius nuokrypius, todėl galite pereiti prie koreliacijos koeficiento formulės. Prisiminti, kad n reiškia jūsų turimų verčių skaičių. Atlikdami anksčiau nurodytus veiksmus, jau parengėte kitą susijusią informaciją.
              • Naudodami pavyzdinius duomenis, galite įvesti duomenis į koreliacijos koeficiento formulę ir apskaičiuoti taip:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = kairė ({ frac {1} {n-1}} dešinė) Sigma kairė ({ frac {x- mu _ {x}} { sigma _ {x}} } dešinė) * kairė ({ frac {y- mu _ {y}} { sigma _ {y}}} dešinė)}Interpretuokite rezultatą. Šio duomenų rinkinio koreliacijos koeficientas yra 0,988. Šis skaičius nurodo du dalykus apie duomenis. Pažvelkite į skaičiaus ženklą ir skaičiaus dydį.
                • Kadangi koreliacijos koeficientas yra teigiamas, galite sakyti, kad tarp x duomenų ir y duomenų yra teigiama koreliacija. Tai reiškia, kad jei x reikšmės padidės, tikitės, kad padidės ir y reikšmės.
                • Kadangi koreliacijos koeficientas yra labai artimas +1, x duomenys ir y duomenys yra labai glaudžiai susiję. Jei pieštumėte šiuos taškus, pamatytumėte, kad jie labai gerai prilygsta tiesei.

2 metodas iš 4: internetinių koreliacijos skaičiuoklių naudojimas

  1. Internete ieškokite koreliacijos skaičiuoklių. Koreliacijos matavimas yra gana įprastas statistikų skaičiavimas. Skaičiavimas gali tapti labai varginantis dideliems duomenų rinkiniams, jei tai atliekama ranka. Todėl daugelis šaltinių internete paskelbė įprastus koreliacijos skaičiavimus. Naudokite bet kurį paieškos variklį ir įveskite paieškos terminą „koreliacijos skaičiuoklė“.
  2. Įveskite duomenis. Atidžiai perskaitykite instrukcijas svetainėje, kad galėtumėte teisingai įvesti duomenis. Svarbu, kad duomenų poros būtų tvarkingos, nes kitaip gausite neteisingą koreliacijos rezultatą. Skirtingose ​​svetainėse duomenims įvesti naudojami skirtingi formatai.
    • Pavyzdžiui, svetainėje http://ncalculators.com/statistics/correlation-coefficient-calculator.htm rasite horizontalų langelį x reikšmėms įvesti ir antrą horizontalų langelį y reikšmėms įvesti. Jūs įveskite sąlygas, atskirtas tik kableliais. Taigi anksčiau šiame straipsnyje apskaičiuotas x duomenų rinkinys turėtų būti įvestas kaip 1,2,4,5. Y duomenų rinkinys įvedamas kaip 1,3,5,7.
    • Kitoje svetainėje, http://www.alcula.com/calculators/statistics/correlation-coefficient/, galite įvesti duomenis horizontaliai arba vertikaliai, jei tik tvarkote duomenų taškus.
  3. Apskaičiuokite rezultatus. Šios skaičiavimo svetainės yra populiarios, nes įvedus duomenis paprastai reikia spustelėti mygtuką „Skaičiuoti“ - rezultatas pasirodys automatiškai.

3 metodas iš 4: naudodamas grafikos skaičiuoklę

  1. Įveskite savo duomenis. Grafikų skaičiuoklėje įjunkite statistikos funkciją ir tada pasirinkite komandą „Redaguoti“.
    • Kiekviename skaičiuotuve yra šiek tiek skirtingos klavišų komandos. Šiame straipsnyje pateikiamos konkrečios „Texas Instruments TI-86“ instrukcijos.
    • Norėdami pasiekti „Stat“ funkciją, paspauskite [2nd] -Stat (virš „+“ klavišo), tada paspauskite F2-Edit.
  2. Ištrinkite visus senus saugomus duomenis. Dauguma skaičiuotuvų saugos statistinius duomenis tol, kol jie bus išvalyti. Norėdami įsitikinti, kad nepainiojote senų duomenų su naujais, pirmiausia turėtumėte ištrinti visą anksčiau išsaugotą informaciją.
    • Rodyklių klavišais perkelkite žymeklį, kad paryškintumėte „xStat“ kategoriją. Tada paspauskite „Išvalyti“ ir „Enter“. Tai turėtų išvalyti visas stulpelio „xStat“ reikšmes.
    • Rodyklių klavišais paryškinkite „yStat“ kategoriją. Paspauskite „Išvalyti“ ir „Enter“, kad taip pat išvalytumėte to stulpelio duomenis.
  3. Įveskite duomenų vertes. Rodyklių klavišais perkelkite žymeklį į pirmąją vietą po „xStat“ antrašte. Įveskite pirmąją duomenų vertę ir paspauskite Enter. Ekrano apačioje turėtumėte pamatyti tarpą „xStat (1) = __“, kur jūsų vertė užpildo tuščią vietą. Kai paspausite Enter, duomenys užpildys lentelę, žymeklis pereis į kitą eilutę, o ekrano apačioje esančioje eilutėje dabar turėtų būti „xStat (2) = __“.
    • Toliau įveskite visas x reikšmes.
    • Įvedę x reikšmes, rodyklių klavišais pereikite į stulpelį „yStat“ ir įveskite y reikšmes.
    • Įvedę visus duomenis, paspauskite „Exit“, kad išvalytumėte ekraną ir išeitumėte iš „Stat“ meniu.
  4. Apskaičiuokite tiesinės regresijos statistiką. Koreliacijos koeficientas yra matas, kaip tiksliai duomenys priartina tiesę. Grafikų skaičiuoklė su statistinėmis funkcijomis gali labai greitai apskaičiuoti geriausią atitikties tiesę ir koreliacijos koeficientą.
    • Įveskite „Stat“ funkciją ir paspauskite mygtuką „Calc“. TI-86 tai yra [2] [Stat] [F1].
    • Pasirinkite tiesinės regresijos skaičiavimus. TI-86 tai yra [F3], pažymėta „LinR“. Tada grafiniame ekrane bus rodoma linija „LinR _“ su mirksinčiu žymekliu.
    • Dabar turite įvesti dviejų kintamųjų, kuriuos norite apskaičiuoti, pavadinimus. Tai yra „xStat“ ir „yStat“.
      • TI-86 pasirinkite vardų sąrašą („Vardai“) paspausdami [2] [Sąrašas] [F3].
      • Apatinėje ekrano eilutėje dabar turėtų būti rodomi galimi kintamieji. Pasirinkite [xStat] (tai tikriausiai yra mygtukas F1 arba F2), tada įveskite kablelį ir tada [yStat].
      • Norėdami apskaičiuoti duomenis, paspauskite Enter
  5. Interpretuokite rezultatus. Kai paspausite Enter, skaičiuoklė nedelsdama apskaičiuos šią informaciją apie jūsų įvestus duomenis:
    • y=a+bX{ displaystyle y = a + bx}Suprasti koreliacijos sampratą. Koreliacija susijusi su statistiniu santykiu tarp dviejų dydžių. Koreliacijos koeficientas yra vienas skaičius, kurį galite apskaičiuoti dviem duomenų taškų rinkiniams. Skaičius visada yra nuo -1 iki +1 ir nurodo, kiek glaudžiai yra abu duomenų rinkiniai.
      • Pvz., Jei pamatuotumėte vaikų, kurių amžius yra maždaug 12 metų, ūgį ir amžių, tikėtumėte rasti stiprią teigiamą koreliaciją. Kai vaikai sensta, jie linkę augti.
      • Neigiamos koreliacijos pavyzdys yra laiko, kurį kažkas praleidžia praktikuodamas golfą, palyginimas su to žmogaus golfo balu. Kai praktika progresuoja, rezultatas turėtų sumažėti.
      • Galų gale, jūs tikitės, kad, pavyzdžiui, žmogaus batų dydis ir jo egzamino pažymiai bus nedaug, teigiami ar neigiami.
    • Apskaičiuokite vidurkį. Duomenų rinkinio aritmetinis vidurkis arba „vidurkis“ apskaičiuojamas sudedant visas duomenų vertes ir padalijant iš rinkinio reikšmių skaičiaus. Norėdami nustatyti savo duomenų koreliacijos koeficientą, turite apskaičiuoti kiekvieno duomenų rinkinio vidurkį.
      • Kintamojo vidurkį rodo kintamasis su horizontalia linija virš jo. Tai dažnai vadinama „x-bar“ arba „y-bar“ x ir y duomenų rinkiniams. Arba vidurkį galima žymėti mažąja graikiška raide μ (mu). Pavyzdžiui, norėdami nurodyti x taškų vidurkį, galite naudoti μX arba μ (x).
      • Pvz., Jei turite x rinkinį (1,2,5,6,9,10), šių duomenų vidurkis apskaičiuojamas taip:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Žinokite standartinio nuokrypio svarbą. Statistikoje standartinis nuokrypis matuoja variaciją, parodydamas skaičių dispersiją nuo vidurkio. Skaičių grupė su mažu standartiniu nuokrypiu yra gana arti viena kitos. Skaičių grupė su dideliu standartiniu nuokrypiu yra labiau išsklaidyta.
          • Kaip simbolis, standartinis nuokrypis išreiškiamas mažąja raide s arba graikiška σ (sigma). Taigi x duomenų standartinis nuokrypis rašomas taip sX arba σX.
        • Pripažinkite apibendrinimo žymėjimą. Sumuojimo operatorius yra vienas iš labiausiai paplitusių matematikos operatorių ir jis nurodo reikšmių sumą. Ją žymi graikų didžioji raidė sigma arba ∑.
          • Pvz., Jei turite duomenų taškų x (1,2,5,6,9,10) rinkinį, tada ∑x reiškia:
            • 1+2+5+6+9+10 = 33

Patarimai

  • Koreliacijos koeficientas kartais vadinamas „Pearson produkto ir momento koreliacijos koeficientu“ jo kūrėjo Karlo Pearsono garbei.
  • Apskritai koreliacijos koeficientas, didesnis nei 0,8 (teigiamas arba neigiamas), rodo stiprią koreliaciją; koreliacijos koeficientas, mažesnis nei 0,5 (teigiamas arba vėl neigiamas), reiškia silpną koreliacijos koeficientą.

Įspėjimai

  • Koreliacija rodo, kad du duomenų rinkiniai yra tam tikru būdu susieti. Tačiau būkite atsargūs ir nelaikykite to priežastiniu ryšiu. Pavyzdžiui, jei palyginsite žmonių batų dydį ir aukštį, greičiausiai rasite stiprią teigiamą koreliaciją. Didesni žmonės paprastai turi didesnes kojas. Tačiau tai nereiškia, kad užaugęs jūsų kojos išaugs arba kad dėl didelių pėdų jūs užaugsite. Jie tiesiog vyksta kartu.