Коментара

Пример два узорка Т теста и интервала поверења

Пример два узорка Т теста и интервала поверења



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Понекад је у статистици корисно видети разрађене примере проблема. Ови примери нам могу помоћи у проналажењу сличних проблема. У овом чланку ћемо проћи кроз поступак вођења инференцијалне статистике за резултат који се односи на два средства становништва. Не само да ћемо видети како извршити тест хипотезе о разлици два средства популације, већ ћемо и изградити интервал поверења за ову разлику. Методе које користимо понекад се називају два узорка т теста и два узорка т интервала поузданости.

Изјава о проблему

Претпоставимо да желимо да тестирамо математичку способност деце школске доби. Једно питање које бисмо могли имати је да ли нивои вишег разреда имају веће средње резултате теста.

Једноставни случајни узорак од 27 трећих разреда има математички тест, њихови одговори се оцењују, а резултати имају просечну оцену од 75 поена са стандардним одступањем узорка од 3 поена.

Једноставни случајни узорак од 20 петих разреда даје се исти тест из математике и њихови одговори се дају. Средња оцена за пете разреде је 84 поена са стандардним одступањем узорка од 5 бодова.

С обзиром на овај сценарио постављамо следећа питања:

  • Да ли нам огледни подаци пружају доказ да средња оцена тестова популације свих петих греда прелази средњу оцену резултата популације свих трећих греда?
  • Колики је интервал поузданости од 95% за разлику у средњим резултатима тестова између популације трећих и петог разреда?

Услови и поступак

Морамо одабрати који поступак да користимо. При томе морамо бити сигурни и проверити да ли су испуњени услови за овај поступак. Од нас се тражи да упоредимо два средства за популацију. Једна збирка метода која се може користити за то је она за т-поступке са два узорка.

Да бисмо користили ове т-процедуре за два узорка, морамо да будемо сигурни да следећи услови важе:

  • Имамо два једноставна случајна узорка из две интересантне популације.
  • Наши једноставни случајни узорци не чине више од 5% популације.
  • Два узорка су међусобно неовисна и не постоји подударање између субјеката.
  • Променљива је нормално дистрибуирана.
  • Обе популације и стандардна девијација су непознате за обе популације.

Видимо да је већина ових услова испуњена. Речено нам је да имамо једноставне случајне узорке. Популација коју проучавамо је велика пошто у овим разредима има милион ученика.

Услов који не можемо аутоматски претпоставити је да се тестови обично дистрибуирају нормално. Будући да имамо довољно велику величину узорка, због робусности наших т-процедура нам није нужно да се променљива нормално дистрибуира.

Пошто су услови задовољени, вршимо неколико прелиминарних калкулација.

Стандардна грешка

Стандардна грешка је процена стандардног одступања. За ову статистику додајемо варијансу узорка узорака и затим узмемо квадратни корен. То даје формулу:

(с1 2 / н1 + с22 / н2)1/2

Употребом горњих вредности видимо да је вредност стандардне грешке

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

Степени слободе

Конзервативну апроксимацију можемо искористити за наше степене слободе. Ово може потценити број степени слободе, али то је много лакше израчунати него користити Велцхову формулу. Користимо мању од две величине узорка, а затим одузмемо један од овог броја.

За наш пример, мањи од два узорка је 20. То значи да је број степени слободе 20 - 1 = 19.

Тест хипотезе

Желели бисмо да тестирамо хипотезу да ученици петих разреда имају средњу оцену теста која је већа од средње оцене ученика трећег разреда. Нека је μ1 бити средњи резултат популације свих петих разреда. Слично томе, пустимо μ2 бити средњи резултат популације свих трећих разреда.

Хипотезе су следеће:

  • Х0: μ1 - μ2 = 0
  • Ха: μ1 - μ2 > 0

Статистика теста је разлика између узорка, која се затим дели стандардном грешком. Будући да користимо узорке стандардних девијација за процену стандардног одступања популације, тестна статистика из т-дистрибуције.

Вредност тестне статистике је (84 - 75) /1.2583. То износи отприлике 7.15.

Сада одређујемо која је п вредност за овај тест хипотезе. Гледамо вредност тестне статистике и где се она налази на т-дистрибуцији са 19 степени слободе. За ову дистрибуцију имамо 4,2 к 10-7 као наша п-вредност. (Један од начина да се то утврди је коришћење Т.ДИСТ.РТ функције у Екцелу.)

Пошто имамо тако малу п-вредност, одбацујемо ништавну хипотезу. Закључак је да је средњи резултат теста за пете разреде виши од средњег теста за треће разреде.

Интервал поверења

Пошто смо утврдили да постоји разлика између средњих резултата, сада одређујемо интервал поузданости за разлику између ова два средства. Већ имамо много онога што нам треба. Интервал поузданости за разлику мора да има и процену и грешку.

Процена разлике двема средствима је једноставно израчунати. Једноставно проналазимо разлику узорака. Ова разлика у узорку значи процену разлике популације.

За наше податке, разлика у средствима узорка је 84 - 75 = 9.

Границу грешке је мало теже израчунати. За то морамо одговарајућу статистику помножити са стандардном грешком. Статистику која нам је потребна проналажемо консултацијама са таблицом или статистичким софтвером.

Опет користећи конзервативну апроксимацију, имамо 19 степени слободе. За интервал поузданости од 95% видимо да т* = 2.09. Могли бисмо користити функцију Т.ИНВ у Екцелу за израчунавање ове вредности.

Сада све саставимо и видимо да је наша грешка 2,09 к 1,2583, што је отприлике 2,63. Интервал поузданости је 9 ± 2,63. Интервал износи од 6,37 до 11,63 бода на тесту који су изабрали пети и трећи разред.


Погледајте видео: 3. Statistički opis uzorka u pogledu jedne kvantitativne varijable u programu SPSS (Август 2022).