Apskaičiuokite kovariaciją

Autorius: Judy Howell
Kūrybos Data: 2 Liepos Mėn 2021
Atnaujinimo Data: 1 Liepos Mėn 2024
Anonim
How To Solve For Covariance
Video.: How To Solve For Covariance

Turinys

Kovariacija yra statistinis skaičiavimas, kad ryšys tarp dviejų duomenų rinkinių būtų skaidresnis. Pavyzdžiui, tarkime, kad antropologai tiria tam tikros kultūros populiacijos ūgį ir svorį. Kiekvieno tyrimo dalyvio ūgį ir svorį galima parodyti kartu su poromis duomenų (x, y). Šios vertės gali būti naudojamos standartinėje formulėje apskaičiuojant kovariacijos santykį. Šiame straipsnyje pirmiausia paaiškinami skaičiavimai nustatant duomenų rinkinio kovariaciją. Toliau bus aptarti du kiti automatizuoti rezultato nustatymo būdai.

Žengti

1 metodas iš 4: apskaičiuokite kovaranciją rankomis, naudodami standartinę formulę

  1. Sužinokite standartinę kovariacijos formulę ir jos dalis. Standartinė kovariacijos skaičiavimo formulė yra Σ(XiXvid)(yiyvid)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Sukurkite savo duomenų lentelę. Prieš pradedant naudinga surinkti duomenis. Sukurkite lentelę, susidedančią iš penkių stulpelių. Kiekvieną stulpelį turite deklaruoti taip:
    • X{ displaystyle x}Apskaičiuokite x duomenų taškų vidurkį. Šiame duomenų rinkinio pavyzdyje yra 9 skaičiai. Norėdami rasti vidurkį, sudėkite juos kartu ir padalykite sumą iš 9. Tai duoda rezultatą 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Kai padalysite iš 9, gausite vidurkį 4.89. Tai vertė, kurią būsimiems skaičiavimams naudosite kaip x (vid.).
    • Apskaičiuokite y duomenų taškų vidurkį. Šį y stulpelį taip pat turi sudaryti 9 duomenų taškai, sutampantys su x duomenų taškais. Nustatykite jų vidurkį. Šiam pavyzdiniam duomenų rinkiniui tai tampa 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Padalinkite šią sumą iš 9, kad gautumėte vidurkį 5,44. Būsimiems skaičiavimams ketinate naudoti 5.44 kaip y (vid.) Vertę.
    • Apskaičiuokite reikšmes (XiXvid){ displaystyle (x_ {i} -x _ { text {avg}})}Apskaičiuokite reikšmes (yiyvid){ displaystyle (y_ {i} -y _ { text {avg}})}Apskaičiuokite kiekvienos duomenų eilutės produktus. Užpildote paskutinio stulpelio eilutes daugindami skaičius, kuriuos apskaičiavote dviejuose ankstesniuose stulpeliuose (XiXvid){ displaystyle (x_ {i} -x _ { text {avg}})}Paskutiniame stulpelyje raskite reikšmių sumą. Čia atsiranda simbolis Σ. Atlikę visus iki šiol atliktus skaičiavimus, susumuokite rezultatus. Šio pavyzdinio duomenų rinkinio paskutiniame stulpelyje dabar turėtumėte turėti devynias reikšmes. Sudėkite tuos devynis skaičius kartu. Atidžiai stebėkite, ar skaičius yra teigiamas, ar neigiamas.
      • Šio pavyzdinio duomenų rinkinio suma turėtų sudaryti iki -64,57. Parašykite šią sumą į vietą stulpelio apačioje. Tai yra standartinės kovariacijos formulės skaitiklio vertė.
    • Apskaičiuokite kovariacijos formulės vardiklį. Standartinės kovariacijos formulės skaitiklis yra jūsų ką tik apskaičiuota vertė. Vardiklį žymi (n-1) ir jis yra vienas mažesnis už duomenų porų skaičių jūsų duomenų rinkinyje.
      • Šiame problemos pavyzdyje yra devynios duomenų poros, taigi n yra 9. Todėl (n-1) reikšmė lygi 8.
    • Padalinkite skaitiklį iš vardiklio. Paskutinis kovariacijos skaičiavimo žingsnis yra padalinti skaitiklį, Σ(XiXvid)(yiyvid){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Atkreipkite dėmesį, kokie yra pasikartojantys skaičiavimai. Kovariacija yra skaičiavimas, kurį keletą kartų turite atlikti rankomis, kad suprastumėte rezultato prasmę. Tačiau jei ketinate reguliariai naudoti kovariantiją interpretuodami duomenis, jums reikia greitesnio ir automatizuoto būdo gauti rezultatus. Dabar jau pastebėjote, kad mūsų palyginti nedidelis duomenų rinkinys, kuriame yra tik devynios duomenų poros, skaičiavimus sudarė iš dviejų vidurkių, aštuoniolikos atskirų atimčių, devynių daugybos, vieno pridėjimo ir galiausiai dar vieno padalijimo. Tai yra 31 palyginti nedidelis skaičiavimas, norint rasti sprendimą. Keliaudami rizikuojate praleisti neigiamus ženklus arba neteisingai nukopijuoti rezultatus, todėl atsakymas nebėra teisingas.
    • Kovariacijai apskaičiuoti sukurkite darbalapį. Jei esate susipažinę su „Excel“ (ar kita skaičiavimo programa), galite lengvai sukurti lentelę kovariacijai nustatyti. Pažymėkite penkių stulpelių antraštes, kaip tai darėte atlikdami ranka: x, y, (x (i) -x (avg)), (y (i) -y (avg)) ir Product.
      • Norėdami supaprastinti pavadinimų suteikimą, trečiąjį stulpelį vadinkite „x skirtumu“, o ketvirtąjį - „y skirtumu“, jei tik prisimenate duomenų reikšmę.
      • Jei lentelė prasideda viršutiniame kairiajame darbalapio kampe, langelis A1 bus pažymėtas x, o kitos etiketės tęsiasi iki langelio E1.
    • Įveskite duomenų taškus. Įveskite duomenų vertes į du stulpelius x ir y. Atminkite, kad duomenų taškų tvarka yra svarbi, todėl kiekvieną y turite atitikti atitinkama x reikšme.
      • „X“ vertės prasideda langelyje A2 ir tęsiasi iki jums reikalingų duomenų taškų skaičiaus.
      • Y reikšmės prasideda B2 langelyje ir tęsiasi iki jums reikalingų duomenų taškų skaičiaus.
    • Nustatykite x ir y reikšmių vidurkius. „Excel“ labai greitai apskaičiuoja jūsų vidurkius. Pirmoje tuščioje langelyje po kiekvienu duomenų stulpeliu įveskite formulę = AVERAGE (A2: A ___). Užpildykite tuščią vietą langelio numeriu, atitinkančiu jūsų paskutinį duomenų tašką.
      • Pavyzdžiui, jei turite 100 duomenų taškų, langeliai nuo A2 iki A101 užpildomi, todėl langelyje įveskite = AVERAGE (A2: A101).
      • Y duomenims įveskite formulę = AVERAGE (B2: B101).
      • Atminkite, kad „Excel“ formulė prasideda ženklu „=“.
    • Įveskite stulpelio formulę (x (i) -x (avg)). C2 langelyje įveskite pirmojo atimties skaičiavimo formulę. Ši formulė tampa: = A2 -___. Užpildykite tuščią vietą langelio adresu, kuriame yra x duomenų vidurkis.
      • Pavyzdžiui, iš 100 duomenų taškų vidurkis bus langelyje A103, taigi jūsų formulė taps: = A2-A103.
    • Pakartokite duomenų taškų (y (i) -y (avg)) formulę. Sekdamas tuo pačiu pavyzdžiu, jis patenka į D2 langelį. Formulė tampa: = B2-B103.
    • Įveskite stulpelio „Produktas“ formulę. Penktajame stulpelyje E2 langelyje įveskite formulę, kad apskaičiuotumėte dviejų ankstesnių langelių sandaugą. Tada tai tampa: = C2 * D2.
    • Nukopijuokite formules, kad užpildytumėte lentelę. Iki šiol jūs programavote tik kelis pirmuosius duomenų taškus 2 eilutėje. Naudodami pelę pažymėkite langelius C2, D2 ir E2. Užveskite žymeklį ant mažos dėžutės apatiniame dešiniajame kampe, kol pasirodys pliuso ženklas. Spustelėkite ir laikykite pelės mygtuką ir vilkite pelę žemyn, kad išplėstumėte pasirinkimą ir užpildytumėte visą duomenų lentelę. Šis žingsnis automatiškai nukopijuos tris formules iš langelių C2, D2 ir E2 į visą lentelę. Lentelė turėtų būti automatiškai užpildyta visais skaičiavimais.
    • Užprogramuokite paskutinio stulpelio sumą. Jums reikia stulpelio „Produktas“ elementų sumos. Tuščiame langelyje iškart po paskutiniu to stulpelio duomenų tašku įveskite formulę: = SUM (E2: E ___). Užpildykite tuščią vietą paskutinio duomenų taško langelio adresu.
      • Pavyzdyje, kuriame yra 100 duomenų taškų, ši formulė patenka į langelį E103. Tipas: = SUM (E2: E102).
    • Nustatykite kovariaciją. Taip pat galite leisti „Excel“ atlikti galutinį skaičiavimą už jus. Paskutinis skaičiavimas mūsų pavyzdžio langelyje E103 reiškia kovariacijos formulės skaitiklį. Tiesiai žemiau tos langelio įveskite formulę: = E103 / ___. Užpildykite tuščią vietą turimų duomenų taškų skaičiumi. Mūsų pavyzdyje tai yra 100. Rezultatas yra jūsų duomenų kovariacija.

3 metodas iš 4: internetinių kovariacijos skaičiuoklių naudojimas

  1. Kovariacijos skaičiuoklių galite ieškoti internete. Įvairios mokyklos, įmonės ar kiti šaltiniai turi svetaines, kuriose labai lengvai apskaičiuojamos kovariacijos vertės. Paieškos sistemoje naudokite paieškos terminą „kovariacijos skaičiuoklė“.
  2. Įveskite savo duomenis. Atidžiai perskaitykite instrukcijas svetainėje ir įsitikinkite, kad teisingai įvedėte informaciją. Svarbu, kad jūsų duomenų poros būtų tvarkingos, kitaip sugeneruotas rezultatas bus neteisingas kovarijus. Svetainėse yra skirtingi duomenų įvedimo stiliai.
    • Pavyzdžiui, svetainėje http://ncalculators.com/statistics/covariance-calculator.htm yra horizontalus langelis x reikšmėms įvesti ir antras horizontalus langelis y reikšmėms įvesti. Turite įvesti duomenis atskyrę kableliais. Taigi x duomenų rinkinys, apskaičiuotas anksčiau šiame straipsnyje, turėtų būti įvestas kaip 1,3,2,5,8,7,12,2,4. Y duomenys kaip 8,6,9,4,3,3,2,7,7.
    • Kitoje svetainėje, https://www.thecalculator.co/math/Covariance-Calculator-705.html, jūsų bus paprašyta pirmajame laukelyje įvesti x duomenis. Duomenys įvedami vertikaliai, po vieną elementą kiekvienoje eilutėje. Todėl įrašas šioje svetainėje atrodo taip:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Apskaičiuokite savo rezultatus. Šiuos internetinius skaičiavimus patraukliausia tai, kad įvedus duomenis dažniausiai tereikia spustelėti mygtuką „Skaičiuoti“ ir rezultatai bus rodomi automatiškai. Daugelyje svetainių bus pateikti tarpiniai x (avg), y (avg) ir n skaičiavimai.

4 metodas iš 4: Kovariacijos rezultatų aiškinimas

  1. Ieškokite teigiamų ar neigiamų santykių. Kovariacija yra vienas statistinis skaičius, nurodantis santykį tarp vieno ir kito duomenų rinkinio. Įžangoje minėtame pavyzdyje matuojamas ūgis ir svoris. Galite tikėtis, kad augant žmonėms didės ir jų svoris, o tai lems teigiamą kovariacijos požiūrį. Kitas pavyzdys: Tarkime, yra renkami duomenys, rodantys, kiek valandų kažkas praktikuoja golfą ir kokį rezultatą jis ar ji pasiekia. Tokiu atveju tikitės neigiamo kovariacijos, o tai reiškia, kad didėjant treniruočių valandoms, golfo rezultatas sumažės. (Golfe geresnis mažesnis rezultatas).
    • Apsvarstykite aukščiau apskaičiuotą duomenų rinkinį. Gautas kovariacija yra -8,07. Minuso ženklas reiškia, kad didėjant x reikšmėms, y reikšmės linkusios mažėti. Galite įsitikinti, kad tai tiesa, pažvelgus į kai kurias vertybes. Pavyzdžiui, x reikšmės 1 ir 2 atitinka y reikšmes 7, 8 ir 9. x reikšmės 8 ir 12 yra susietos su y, atitinkamai, 3 ir 2 reikšmėmis. .
  2. Interpretuokite kovariacijos dydį. Jei kovariacijos balo skaičius yra didelis - didelis teigiamas skaičius arba didelis neigiamas skaičius, tai galite interpretuoti kaip du tarpusavyje glaudžiai susijusius duomenų elementus, teigiamai arba neigiamai.
    • Imties duomenų rinkinio kovariacija -8,07 yra gana didelė. Atkreipkite dėmesį, kad duomenys svyruoja nuo 1 iki 12. Taigi 8 yra gana didelis skaičius. Tai rodo gana tvirtą duomenų rinkinių x ir y ryšį.
  3. Suprasti santykių trūkumą. Jei jūsų rezultatas yra kovariacija, lygi arba labai artima 0, galite padaryti išvadą, kad duomenų taškai nėra susiję. Tai yra, vienos vertės padidėjimas gali, bet neprivalo didinti kitos vertės. Abu terminai yra susieti beveik atsitiktinai.
    • Tarkime, kad batų dydžius siejate su egzaminų pažymiais. Kadangi yra labai daug veiksnių, turinčių įtakos studento egzaminų pažymiams, galima tikėtis kovariacijos balo, artimo 0. Tai rodo, kad tarp šių dviejų vertybių beveik nėra ryšio.
  4. Peržiūrėkite santykį grafiškai. Norėdami vizualiai suprasti kovariaciją, duomenų taškus galite braižyti x, y grafike. Tai atlikdami turėtumėte gana lengvai pamatyti, kad taškai, nors ir ne visai tiesūs, linkę artėti į grupę įstriža linija iš viršaus į kairę į apačią į dešinę. Tai apibūdina neigiamą kovariaciją. Taip pat galite pamatyti, kad kovariacijos vertė lygi -8,07. Tai yra gana didelis skaičius, palyginti su duomenų taškais. Didelis skaičius rodo, kad kovariacija yra gana stipri, kurią galite padaryti iš duomenų taškų linijinės formos.
    • Norėdami tai dar kartą perskaityti, skaitykite straipsnius apie taškų piešimą „wikiHow“ koordinačių sistemoje.

Įspėjimai

  • Kovariacija statistikoje taikoma ribotai. Dažnai tai yra žingsnis link koreliacijos koeficientų ar kitų sąvokų apskaičiavimo. Būkite atsargūs dėl pernelyg drąsių interpretacijų, pagrįstų kovariacijos balu.