Какво трябва да знаем:     Числови характеристики на непрекъсната случайна величина
Нормално разпределение
Намиране на доверителен интервал на случайна величина, свързана с нормалното разпределение
Теория на вероятностите
Висша математика III част

Нулева хипотеза и нейното отхвърляне

Материалните беди на човека започват от приемането на нулата като символ за число.
Затова, този символ трябва да бъде зачертнат, отхвърлен и заменен със символа безкрайност.

Чешит от телевизионното предаване "Чешити" – вече неизлъчвано.
Нулевата хипотеза може да се отхвърли, но не и да се потвърди. Целта на проверката на хипотезта е нейното отхвърляне или не въз основа на експерименталните данни.
Нулевата хипотеза ( H0 ) касае неизвестен параметър на генералната съвкупност ( популацията). Нека например µ1 и µ2 ( неизвестни параметри ) са средните времената на реакция на при употреба на алкохол и в трезво състояние.
Нулевата хипотеза е че µ1 - µ2 = 0 . Така, че нулевата хипотеза касае параметъра µ1 - µ2 и тя твърди че този параметър е 0.
Тя често ( да не кажем почти винаги ) е противоположна на убеждението на експериментатора ( опитващия ). В посочения случай той вярва, че експеримента ( опитът ) ще покаже, че има значима разлика във времето на реакция при употреба на алкохол и в трезво състояние. Ако експеримента потвърди тази значимост нулевата хипотеза ще се отхвърли.
Трябва да се подчертае, че изследователите изказват нулевата хипотеза с надеждата да я опровергаят.
Например ако учител е въвел нов метод на преподаване той го сравнява със стария посредством въпросник. Той се надява показателите при учениците, учени по новия метод да бъдат по-добри.
Нулевата хипотеза се изказва като: H0 : µ1 = µ2 или като H0 : µ1 - µ2 = 0 . Тя е хипотеза за липса на разлика между средните от две генерални съвкупности.
Въпреки "нулата" в словосъчетанието "нулева хипотеза" има случаи в които параметърът не е нула. Например ако се предполага че стойността на средното значение на величина, отнасяща се към генералната съвкупност има определена стойност.
Когато се изпълнява едностранния тест нулевата хипотеза включва посоката на резултата. Едностранния тест е проверка за разликата между две средни в определена посока. Тогава тя се формулира като H0 : µ1 ≥ µ2.
Да направим две извадки от двете генерални съвкупности с еднакъв брой единици – n и определем техните средни - M1 и M2.
Ако M1 – M2 е много по-малко от нула нулевата хипотеза се отхвърля в полза на противоположното предположение: µ1 - µ2 < 0 .
1. Първата стъпка в праверката на хипотезата ( предположението ) е изразяването на нулевото предположение ( H0 ) и неговото противоположно ( H1 ). Трябва да изразим писменно нулевата хипотеза и нейната алтернатива ( противоположното твърдение ).
2. Избира се ниво на значимост. Обикновено се използват нивата 0,05 и 0,01.
3. Изчислява се статистиката ( M ) съответваща на параметъра участващ в нулевото предположение. Ако нулевата хипотеза, е определена като H0 : μ1- μ2 = 0 трябва да се определи статистиката M1 - M2 .
4. Определя се стойността на вероятността ( често наричана p-стойност). p-стойността е вероятността да получим статистика ( M или M1 - M2 ) толкова (или повече) различна от стойността на параметъра (μ или μ1- μ2 ), използван в нулевата хипотеза.
p-стойност –p_value
Изчисленията на M и p-стойността се извършват при предположение, че нулевото предположение е вярно.

Подробно обяснен пример

В този пример, предполагаме нормално разпределение с известно стандартно отклонение σ, да кажем σ = 100. Нулевата хипотеза ( предположение ) е че µ = 500. Избрана е извадка от 50 единици и средния параметър ( M ) за нея е със стойност 530. Статистиката ( M ) се различава от стойността на параметъра в нулеват хипотеза ( µ ) с 30 единици. Каква е вероятността за събитието M да се отличава от µ с 30 и повече единици? Разпределението на M е известно. То е нормално със стандартна грешка равна на Стандартна грешка на извадката -calcSigma .
Стандартното отклонение при нормално разпределение се нарича още стандартна грешка. За настоящия пример средната стойност на разпределението на извадката се предполага че е 500 а стандартната грешка е 100/7,07 = 14,14. Разпределението на средното за извадки от 50 единици. Тогава разпределението на средното за извадките е показано на следващата фигура.
Графика на разпределението-p_value1
Математическото очакване ( средното ( µ ) ) е 500. Едно стандартно отклонение е приблизително 14. По абцисата са нанесени четири стандартни отклонения вдясно и вляво от средната величина. Оцветената в оранжаво част е областта под графиката, с абциса по-голяма от 30. Тогава нейната площ представлява вероятността изчисленото средно за извадката (M) да бъде отдалечено от μ = 500 с 30 и повече единици. Тази площ може да бъде определена от z-таблица или калкулатора и се нарича p - стойност . Преди това разглежданото разпределение се привежда към нормално, със средна стойност 0 и дисперсия 1 – n(0,1) чрез смяната :Привеждане към нормално разпределение--ToNormFrm .
В нашия случай тя е p = 0.034.
5. Определената вероятност p се сравнява с нивото на значимост условено от точка 2. Да припомним, че нивото на значимост е обикновено е 0,05 и 0,01. Ако р е по-малко или равно на нивото на значимост то хипотезата се отхвърля ( което е по-добрата от двете възможности). Ако е обратното - вероятността p е по-голяма от нивото на значимост нулевата хипотеза не се отхвърля, което не означава че се приема. Ако нулевата хипотеза се отхвърли се казва, че резултатът е "статистически значим".
Ако тя не се отхвърли в резултат на експеримента се казва, че резултатът "не е статистически значим". Казва се, още че статистическите данни са недостатъчни да се отхвърли нулевата хипотеза.
6. Ако изводът е, че нулевата хипотеза се отхвърля се приема алтернативната ( противоположната ) хипотеза μ1 ≠ μ2 .
Ако M1 е по-голямо от M2 е естествено да се заключи, че μ1 ≥ μ2 .

Какво ще научим:    
Задачи за проверка на хипотези
Теория на вероятностите
Висша математика III част

Литература:
  1. http://teststat.hit.bg/file7.html Проверка на хипотези / частично финансирано от Университет "Проф. д-р Асен Златаров" - Бургас
    Последна редакция 10.2008 г. За контакт: stat_pd@yahoo.com
    Тук подробно е обяснено и как се използва "Exel" за проверка на хипотези. Това става чрез по-прецизния в случая - t–тест.
    Аз не получих от университета никакви пари за страницата, макар че работя в него. – Срамота!

  2. http://ru.wikihow.com Как вычислить доверительный интервал О. Киселова, Арина Ив.

  3. Статистика. Вероятность. Комбинаторика / Я. С. Бродский. — М.: ООО «Издательство Оникс»: ООО «Издательство «Мир и Образование», 2008. — 544 с.: ил. — (Школьный курс математики).