Kaip įvertinti statistinį reikšmingumą

Autorius: Randy Alexander
Kūrybos Data: 2 Balandis 2021
Atnaujinimo Data: 26 Birželio Birželio Mėn 2024
Anonim
Understanding Statistical Significance - Statistics help
Video.: Understanding Statistical Significance - Statistics help

Turinys

Hipotezių testavimas atliekamas remiantis statistine analize. Statistiškai reikšmingas patikimumas apskaičiuojamas naudojant p reikšmę, kuri nurodo pastebėto rezultato tikimybę, kai tam tikras teiginys (nulinė hipotezė) yra teisinga. Jei p reikšmė yra mažesnė už reikšmingumo lygį (paprastai 0,05), eksperimentuotojas gali padaryti išvadą, kad pakanka įrodymų paneigti nulinę hipotezę ir pripažinti atvirkštinę hipotezę. Naudodami paprastą t testą, galite apskaičiuoti p reikšmę ir nustatyti reikšmingumą tarp dviejų skirtingų duomenų grupių.

Žingsniai

1 dalis iš 3: nustatykite eksperimentus

  1. Nustatykite savo hipotezę. Pirmas žingsnis vertinant statistinį reikšmingumą yra atsakomų klausimų nustatymas ir hipotezės deklaravimas. Hipotezė yra empirinių duomenų ir galimų gyventojų neatitikimų konstatavimas. Kiekvienas eksperimentas turi nulinę hipotezę ir atvirkštinę hipotezę. Apskritai palyginsite dvi grupes, kad pamatytumėte, ar jos yra vienodos, ar skirtingos.
    • Apskritai hipotezė nėra (H0) patvirtina, kad nėra skirtumo tarp dviejų duomenų grupių. Pavyzdys: studentai, kurie skaito medžiagą prieš pamoką, negauna geresnių galutinių pažymių.
    • Atvirkštinė hipotezė (Ha) prieštarauja nulinei hipotezei ir yra teiginys, kurį bandote patvirtinti savo empiriniais duomenimis. Pavyzdys: studentai, kurie perskaitė medžiagą prieš pamoką, iš tikrųjų gauna geresnius pažymius.

  2. Pasirinkite reikšmingumo lygį, kad nustatytumėte skirtumo laipsnį, kuris gali būti vertinamas kaip reikšmingas duomenyse. Svarbumo lygis (taip pat žinomas kaip alfa) yra riba, kurią pasirenkate reikšmei nustatyti. Jei p reikšmė yra mažesnė arba lygi tam tikram reikšmingumo lygiui, duomenys laikomi statistiškai reikšmingais.
    • Paprastai reikšmingumo lygis (arba alfa) paprastai pasirenkamas 0,05 lygiu - tai reiškia, kad tikimybė pastebėti skirtumus, matomus pagal duomenis, yra atsitiktinė, tik 5%.
    • Kuo didesnis patikimumo lygis (taigi ir mažesnė p reikšmė), tuo prasmingesni rezultatai.
    • Jei reikia daugiau pasitikėjimo, sumažinkite p reikšmę iki 0,01. Maža p vertė dažnai naudojama gamyboje, kad būtų galima nustatyti gaminio defektus. Didelis patikimumo laipsnis yra būtinas norint sutikti, kad kiekviena dalis veiks taip, kaip turėtų.
    • Daugumai hipotezėmis pagrįstų eksperimentų reikšmingumo lygis yra 0,05.

  3. Nuspręskite, ar naudoti vienos ar dviejų uodegų testą. Viena iš „t-test“ prielaidų yra ta, kad jūsų duomenys pasiskirsto normaliai. Normalus pasiskirstymas suformuos varpo kreivę, kai dauguma stebėjimų bus sutelkti. T testas yra matematinis testas, kuriuo patikrinama, ar jūsų duomenys patenka į įprasto pasiskirstymo išorę, aukščiau ar žemiau, „viršutinėje“ kreivės dalyje.
    • Jei nesate tikri, ar duomenys yra virš, ar žemiau kontrolinės grupės, naudokite dviejų uodegų testą. Tai leidžia patikrinti reikšmingumo lygį abiem kryptimis.
    • Jei žinote, kokia yra numatoma jūsų duomenų kryptis, naudokite vienos krypties testą. Aukščiau pateiktame pavyzdyje tikitės, kad studento rezultatai pagerės. Todėl jūs naudojate vienos uodegos testą.

  4. Imties dydį nustatykite atlikdami jėgos analizę. Testo jėga yra gebėjimas stebėti laukiamą rezultatą su tam tikru imties dydžiu. Bendra jėgos (arba β) riba yra 80%. Jėgos analizė gali būti gana sudėtinga be išankstinių duomenų, nes jums reikia šiek tiek informacijos apie laukiamą vidurkį tarp grupių ir jų standartinius nuokrypius. Norėdami nustatyti optimalų duomenų imties dydį, naudokite internetinę jėgos analizę.
    • Mokslininkai dažnai atlieka nedidelį prielaidų tyrimą, norėdami informuoti apie jėgos analizę ir nuspręsti imties dydį, reikalingą dideliam ir išsamiam tyrimui.
    • Jei nėra galimybių atlikti kompleksinius prielaidų tyrimus, įvertinkite galimą vidurkį, remdamiesi straipsnių skaitymu ir kitų asmenų atliktais tyrimais. Tai gali padėti pradėti imties dydžius.
    skelbimas

2 dalis iš 3: Apskaičiuokite standartinį nuokrypį

  1. Nustatykite standartinio nuokrypio formulę. Standartinis nuokrypis matuoja duomenų sklaidą. Tai suteikia jums informacijos apie kiekvieno imties duomenų taško tapatumą. Pirmą kartą pradedant, lygtys gali atrodyti gana sudėtingos. Tačiau šie veiksmai padės lengvai suprasti skaičiavimo procesą. Formulė yra s = √∑ ((xi - µ) / (N - 1)).
    • s yra standartinis nuokrypis.
    • ∑ rodo, kad turėsite susumuoti visus surinktus stebėjimus.
    • xi kiekvienas reiškia jūsų duomenų vertę.
    • µ yra kiekvienos grupės duomenų vidurkis.
    • N yra bendras stebėjimų skaičius.
  2. Vidutinis pastebėtų kiekvienos grupės duomenų vidurkis. Norėdami apskaičiuoti standartinį nuokrypį, pirmiausia turite apskaičiuoti kiekvienos atskiros grupės stebėjimų vidurkį. Ši vertė simbolizuojama graikiška raide mu arba µ. Norėdami tai padaryti, tiesiog pridėkite stebėjimus ir padalykite iš bendro stebėjimų skaičiaus.
    • Pavyzdžiui, norėdami sužinoti grupės, skaitančios dokumentą prieš pamoką, vidutinį balą, pažiūrėkime į kai kuriuos duomenis. Kad būtų paprasčiau, naudosime 5 taškų duomenų rinkinį: 90, 91, 85, 83 ir 94 (pagal 100 balų skalę).
    • Sumuokite visus pastebėjimus: 90 + 91 + 85 + 83 + 94 = 443.
    • Padalinkite aukščiau pateiktą sumą iš stebėjimų skaičiaus N (N = 5): 443/5 = 88,6.
    • Vidutinis šios grupės balas yra 88,6.
  3. Iš kiekvienos stebimos vertės atimkite vidurkį. Kitas žingsnis apima dalį (xi - µ) lygties. Iš kiekvienos stebimos vertės atimkite vidurkį. Pateikdami aukščiau pateiktą pavyzdį, turime penkis atimimus.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) ir (94 - 88,6).
    • Apskaičiuota vertė yra 1,4; 2,4; -3,6; -5,6 ir 5,4.
  4. Nurodykite aukščiau nurodytus skirtumus ir susumuokite juos. Kiekviena naujai apskaičiuota vertė dabar bus kvadratu. Čia taip pat bus pašalintas neigiamas ženklas. Jei po šio veiksmo arba skaičiavimo pabaigoje pasirodo neigiamas ženklas, tikriausiai pamiršote atlikti pirmiau nurodytą veiksmą.
    • Mūsų pavyzdyje dabar dirbsime su 1,96; 5,76; 12,96; 31.36 ir 29.16.
    • Sudėkite šiuos kvadratus kartu: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Padalinkite iš bendro stebėjimų skaičiaus, atėmus 1. Padalijimas iš N - 1 padeda kompensuoti skaičiavimą, kuris neatliekamas visai populiacijai, tačiau yra pagrįstas tik viena visų studentų populiacijos imtimi.
    • Atimkite: N - 1 = 5 - 1 = 4
    • Padalyti: 81,2 / 4 = 20,3
  6. Gaukite kvadratinę šaknį. Padaliję iš stebėjimų skaičiaus, atėmus 1, paimkite gautos vertės kvadratinę šaknį. Tai yra paskutinis žingsnis apskaičiuojant standartinį nuokrypį. Kai kurios statistikos programos padės atlikti šį skaičiavimą importavus pradinius duomenis.
    • Pateikus aukščiau pateiktą pavyzdį, studentų, skaitančių dokumentą prieš pamoką, semestro pabaigos klasės standartinis nuokrypis yra: s = √20,3 = 4,51.
    skelbimas

3 dalis iš 3: Statistinio reikšmingumo nustatymas

  1. Apskaičiuokite dviejų jūsų stebėjimų grupių dispersiją. Iki šiol pavyzdyje buvo nagrinėjama tik viena stebėjimų grupė. Norint palyginti dvi grupes, akivaizdu, kad reikia duomenų iš abiejų. Apskaičiuokite antrosios stebėjimų grupės standartinį nuokrypį ir juo apskaičiuokite dviejų eksperimentinių grupių dispersiją. Dispersijos apskaičiavimo formulė yra: sd = √ ((s1/ N1) + (s2/ N2)).
    • Sd yra dispersija tarp grupių.
    • S1 yra 1 ir N grupių standartinis nuokrypis1 yra 1 grupės dydis.
    • S2 yra 2 ir N grupių standartinis nuokrypis2 yra 2 grupės dydis.
    • Mūsų pavyzdyje sakykime, kad 2 grupės duomenų (studentų, kurie neskaitė teksto prieš pamoką) duomenys yra 5, o standartinis nuokrypis - 5,81. Dispersija yra:
      • Sd = √ ((s1) / N1) + ((s2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Apskaičiuokite duomenų t balą. T statistika leidžia konvertuoti duomenis į formą, kuri yra palyginama su kitais duomenimis. T reikšmė taip pat leidžia atlikti t testą - testą, kuris leidžia apskaičiuoti statistiškai reikšmingo abiejų grupių skirtumo tikimybę. T-statistikos skaičiavimo formulė yra: t = (µ1 – µ2) / Sd.
    • µ1 yra pirmosios grupės vidurkis.
    • µ2 yra antrosios grupės vidurkis.
    • Sd yra dispersija tarp stebėjimų.
    • Didesnį vidurkį naudokite kaip µ1 kad negautų neigiamos t-statistikos.
    • Pavyzdžiui, tarkime, kad pastebėtas 2 grupės (kuri neskaitė ankstesnio straipsnio) vidurkis yra 80. t balas yra: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Nustatykite mėginio laisvumo laipsnį. Naudojant t-statistiką, laisvės laipsniai nustatomi pagal imties dydį. Sumuokite kiekvienos grupės stebėjimų skaičių ir atimkite du. Ankstesniame pavyzdyje laisvės laipsnis (d.f.) yra 8, nes pirmoje grupėje yra 5 mėginiai, o antrojoje - 5 mėginiai ((5 + 5) - 2 = 8).
  4. Norėdami įvertinti reikšmingumą, naudokite lentelę t. T reikšmių ir laisvės laipsnių lenteles galima rasti standartinėje statistikos knygoje arba internete. Raskite eilutę, kurioje yra duomenų laisvumo laipsniai ir p reikšmė, atitinkanti jūsų turimą t statistiką.
    • Esant 8 laisvės laipsniams ir t = 2,61, vienos uodegos bandymo p vertė yra nuo 0,01 iki 0,025. Kadangi pasirinktas reikšmingumo lygis yra mažesnis arba lygus 0,05, mūsų duomenys yra statistiškai reikšmingi. Turėdami šiuos duomenis, mes atmetame nulinę hipotezę ir sutinkame su atvirkštine hipoteze: studentai, perskaitę medžiagą prieš pamoką, turi aukštesnius galutinius balus.
  5. Apsvarstykite galimybę atlikti tolesnius tyrimus. Daugelis tyrėjų tam tikra priemone atlieka prielaidų tyrimus, kad suprastų, kaip sukurti didesnį tyrimą. Atlikę kitus tyrimus naudodami daugiau metrikų, padidinsite savo pasitikėjimą savo išvadomis. skelbimas

Patarimas

  • Statistika yra didelė ir sudėtinga sritis. Laikykitės vidurinės mokyklos ar universiteto (ar aukštesnio) statistinių hipotezių testavimo kurso, kad suprastumėte statistinį reikšmingumą.

Įspėjimas

  • Ši analizė orientuota į t testą, kad būtų galima patikrinti skirtumą tarp dviejų standartinių pasiskirstymo populiacijų. Atsižvelgiant į duomenų sudėtingumą, gali prireikti dar vieno statistinio testo.