Ako urobiť T test v Exceli

Obsah:

Ako urobiť T test v Exceli
Ako urobiť T test v Exceli
Anonim

T-test je spôsob, ako rozhodnúť, či existujú štatisticky významné rozdiely medzi súbormi údajov pomocou študentského t-rozdelenia. T-test v Exceli je dvojvzorkový T-test porovnávajúci priemer dvoch vzoriek. Tento článok vysvetľuje, čo znamená štatistická významnosť, a ukazuje, ako vykonať T-test v Exceli.

Pokyny v tomto článku platia pre Excel 2019, 2016, 2013, 2010, 2007; Excel pre Microsoft 365 a Excel Online.

Image
Image

Čo je štatistická významnosť?

Predstavte si, že chcete vedieť, ktorá z dvoch kociek dá lepšie skóre. Hodíte prvou kockou a dostanete 2; hodíte druhou kockou a dostanete 6. Hovorí vám to, že druhá kocka zvyčajne dáva vyššie skóre? Ak ste odpovedali: „Samozrejme, že nie“, potom už chápete štatistickú významnosť. Chápete, že rozdiel bol spôsobený náhodnou zmenou skóre pri každom hode kockou. Pretože vzorka bola veľmi malá (iba jeden kotúč), neukázala nič významné.

Teraz si predstavte, že každou kockou hodíte 6-krát:

  • Prvá kocka hodí 3, 6, 6, 4, 3, 3; Priemer=4,17
  • Druhá kocka hodí 5, 6, 2, 5, 2, 4; Priemer=4,00

Dokazuje to teraz, že prvá kocka dáva vyššie skóre ako druhá? Pravdepodobne nie. Malá vzorka s relatívne malým rozdielom medzi priemermi spôsobuje, že je pravdepodobné, že rozdiel je stále spôsobený náhodnými odchýlkami. Keď zvyšujeme počet hodov kockami, je ťažké dať rozumnú odpoveď na otázku – je rozdiel medzi skóre výsledkom náhodných variácií alebo je skutočne pravdepodobnejšie, že jedno poskytne vyššie skóre ako druhé?

Významnosť je pravdepodobnosť, že pozorovaný rozdiel medzi vzorkami je spôsobený náhodnými odchýlkami. Význam sa často nazýva hladina alfa alebo jednoducho „α“. Úroveň spoľahlivosti alebo jednoducho „c“je pravdepodobnosť, že rozdiel medzi vzorkami nie je spôsobený náhodnou odchýlkou; inými slovami, že existuje rozdiel medzi základnými populáciami. Preto: c=1 – α

Ako môžeme nastaviť na ľubovoľnú úroveň, aby sme mali istotu, že sme preukázali význam. Veľmi často sa používa α=5% (95% spoľahlivosť), ale ak si chceme byť naozaj istí, že akékoľvek rozdiely nie sú spôsobené náhodnými variáciami, môžeme použiť vyššiu úroveň spoľahlivosti pomocou α=1% alebo dokonca α=0,1 %.

Na výpočet významnosti v rôznych situáciách sa používajú rôzne štatistické testy. T-testy sa používajú na určenie, či sú priemery dvoch populácií rozdielne a F-testy sa používajú na určenie, či sú rozdiely rozdielne.

Prečo testovať štatistickú významnosť?

Pri porovnávaní rôznych vecí musíme použiť testovanie významnosti, aby sme zistili, či je jedna lepšia ako druhá. Týka sa to mnohých polí, napríklad:

  • V podnikaní ľudia potrebujú porovnávať rôzne produkty a marketingové metódy.
  • V športe musia ľudia porovnávať rôzne vybavenie, techniky a konkurentov.
  • V strojárstve musia ľudia porovnávať rôzne konštrukcie a nastavenia parametrov.

Ak chcete v akejkoľvek oblasti otestovať, či niečo funguje lepšie ako niečo iné, musíte otestovať štatistickú významnosť.

Čo je študentská T-distribúcia?

A Studentovo t-rozdelenie je podobné normálnemu (alebo Gaussovmu) rozdeleniu. Toto sú obe distribúcie v tvare zvona, pričom väčšina výsledkov sa blíži k priemeru, ale niektoré zriedkavé udalosti sú dosť ďaleko od priemeru v oboch smeroch, označované ako chvosty distribúcie.

Presný tvar študentského t-rozdelenia závisí od veľkosti vzorky. Pre vzorky viac ako 30 je to veľmi podobné normálnemu rozdeleniu. Keď sa veľkosť vzorky zmenšuje, chvosty sa zväčšujú, čo predstavuje zvýšenú neistotu, ktorá pochádza z vytvárania záverov na základe malej vzorky.

Ako urobiť T-test v Exceli

Skôr ako budete môcť použiť T-test na určenie, či existuje štatisticky významný rozdiel medzi priemermi dvoch vzoriek, musíte najskôr vykonať F-test. Je to preto, že pre T-test sa vykonávajú rôzne výpočty v závislosti od toho, či existuje významný rozdiel medzi odchýlkami.

Na vykonanie tejto analýzy budete potrebovať povolený doplnok Analysis Toolpak.

Kontrola a načítanie doplnku analytických nástrojov

Ak chcete skontrolovať a aktivovať analytický nástroj, postupujte podľa týchto krokov:

  1. Vyberte kartu FILE >select Options.
  2. V dialógovom okne Možnosti vyberte z kariet na ľavej strane Add-Ins.
  3. V spodnej časti okna vyberte rozbaľovaciu ponuku Spravovať a potom vyberte Doplnky Excelu. Vybrať Prejsť.

    Image
    Image
  4. Uistite sa, že je začiarknuté políčko vedľa položky Analysis Toolpack, potom vyberte OK.

  5. Analýza je teraz aktívna a ste pripravení použiť F-testy a T-testy.

Vykonanie F-testu a T-testu v Exceli

  1. Zadajte dve množiny údajov do tabuľky. V tomto prípade uvažujeme o predaji dvoch produktov počas týždňa. Vypočíta sa aj priemerná denná hodnota predaja pre každý produkt spolu s jeho štandardnou odchýlkou.

    Image
    Image
  2. Vyberte kartu Údaje > Analýza údajov

    Image
    Image
  3. Vyberte F-Test Two-Sample for Variances zo zoznamu a potom vyberte OK.

    Image
    Image

    F-Test je vysoko citlivý na nenormálnosť. Preto môže byť bezpečnejšie použiť Welchov test, ale v Exceli je to ťažšie.

  4. Vyberte rozsah premennej 1 a rozsah premennej 2; nastaviť alfa (0,05 dáva 95% spoľahlivosť); vyberte bunku pre ľavý horný roh výstupu, berúc do úvahy, že to vyplní 3 stĺpce a 10 riadkov. Vyberte OK.

    Image
    Image

    Pre rozsah premennej 1 sa musí vybrať vzorka s najväčšou štandardnou odchýlkou (alebo rozptylom).

  5. Zobrazte si výsledky F-testu a zistite, či existuje významný rozdiel medzi odchýlkami. Výsledky poskytujú tri dôležité hodnoty:

    • F: pomer medzi rozptylmi.
    • P(F<=f) one-tail: Pravdepodobnosť, že premenná 1 v skutočnosti nemá väčší rozptyl ako premenná 2. Ak je väčšia ako alfa, je vo všeobecnosti 0,05, potom medzi rozptylmi nie je žiadny významný rozdiel.
    • F Critical one-tail: Hodnota F, ktorá by bola potrebná na získanie P(F<=f)=α. Ak je táto hodnota väčšia ako F, znamená to tiež, že medzi rozptylmi nie je žiadny významný rozdiel.

    P(F<=f) možno vypočítať aj pomocou funkcie FDIST s F a stupňami voľnosti pre každú vzorku ako jej vstupmi. Stupne voľnosti sú jednoducho počet pozorovaní vo vzorke mínus jedna.

  6. Teraz, keď viete, či existuje rozdiel medzi odchýlkami, môžete vybrať vhodný T-test. Vyberte kartu Data > Analýza údajov, potom vyberte buď t-Test: Two-Sample Assumle Equal Variancesalebo t-Test: Dve vzorky za predpokladu nerovnakých rozdielov

    Image
    Image
  7. Bez ohľadu na to, ktorú možnosť ste si vybrali v predchádzajúcom kroku, zobrazí sa vám rovnaké dialógové okno na zadanie podrobností analýzy. Ak chcete začať, vyberte rozsahy obsahujúce vzorky pre Variable 1 Range a Variable 2 Range.

    Image
    Image
  8. Za predpokladu, že chcete otestovať žiadny rozdiel medzi priemermi, nastavte Hypothesized Mean Difference na nulu.
  9. Nastavte hladinu významnosti alfa (0,05 poskytuje 95% spoľahlivosť) a vyberte bunku pre ľavý horný roh výstupu, pričom vezmite do úvahy, že to vyplní 3 stĺpce a 14 riadkov. Vyberte OK.
  10. Pozrite si výsledky a rozhodnite, či existuje významný rozdiel medzi priemermi.

    Rovnako ako pri F-teste, ak je p-hodnota, v tomto prípade P(T<=t), väčšia ako alfa, potom nie je žiadny významný rozdiel. V tomto prípade sú však dané dve hodnoty p, jedna pre jednostranný test a druhá pre dvojstranný test. V tomto prípade použite obojstrannú hodnotu, pretože každá premenná s vyšším priemerom by predstavovala významný rozdiel.

Odporúča: