Oc-windows.ru

IT Новости из мира ПК
5 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Критерий фишера в excel

Распределение Фишера (F-распределение). Распределения математической статистики в EXCEL

Рассмотрим распределение Фишера (F-распределение). С помощью функции MS EXCEL F .РАСП() построим графики функции распределения и плотности вероятности, поясним применение этого распределения для целей математической статистики.

F-распределение (англ. F-distribution) применяется для целей дисперсионного анализа (ANOVA), при проверке гипотезы о равенстве дисперсий двух нормальных распределений (F-тест) и др.

Определение : Если U 1 и U 2 независимые случайные величины, имеющие ХИ2-распределение с k 1 и k 2 степенями свободы соответственно, то распределение случайной величины:

носит название F -распределения с параметрами k 1 и k 2 .

Плотность F -распределения выражается формулой:

где Г(…) – гамма-функция:

если альфа – положительное целое, то Г( альфа )=( альфа -1)!

Приведем пример случайной величины, имеющей F -распределение.

Пусть имеется 2 нормальных распределения N(μ 11 ) и N(μ 2 ; σ 2 ), из которых сделаны выборки размером n 1 и n 2 . Если s 1 2 и s 2 2 – дисперсии этих выборок , то отношение

имеет F -распределение. Это соотношение нам потребуется при проверке гипотезы о равенстве дисперсий двух нормальных распределений (F-тест) .

Графики функций

В файле примера на листе График приведены графики плотности распределения вероятности и интегральной функции распределения .

Примечание : Для построения функции распределения и плотности вероятности можно использовать диаграмму типа График или Точечная (со сглаженными линиями и без точек). Подробнее о построении диаграмм читайте статью Основные типы диаграмм .

F-распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для F-распределения имеется специальная функция F.РАСП() , английское название – F.DIST(), которая позволяет вычислить плотность вероятности (см. формулу выше) и интегральную функцию распределения (вероятность, что случайная величина Х, имеющая Fраспределение , примет значение меньше или равное х, P(X Примечание : Плотность вероятности можно также вычислить впрямую, с помощью формул (см. файл примера ).

До MS EXCEL 2010 в EXCEL была функция FРАСП() , которая позволяет вычислить функцию распределения (точнее — правостороннюю вероятность, т.е. P(X>x)). Функция FРАСП() оставлена в MS EXCEL 2010 для совместимости. Аналогом FРАСП() является функция F.РАСП.ПХ() , появившаяся в MS EXCEL 2010.

Примеры расчетов приведены в файле примера на листе Функции .

В MS EXCEL имеется еще одна функция, использующая для расчетов F-распределение – это F.ТЕСТ(массив1;массив2) . Эта функция возвращает результат F-теста : двухстороннюю вероятность того, что разница между дисперсиями выборок «массив1» и «массив2» несущественна. Предполагается, что выборки делаются из нормального распределения .

Обратная функция F-распределения

Обратная функция используется для вычисления альфа — квантилей , т.е. для вычисления значений x при заданной вероятности альфа , причем х должен удовлетворять выражению P

Функция F.ОБР.ПХ() используется для вычисления верхнего квантиля . Т.е. если в качестве аргумента функции указан уровень значимости, например 0,05, то функция вернет такое значение случайной величины х, для которого P(X>x)=0,05. В качестве сравнения: функция F.ОБР() вернет такое значение случайной величины х, для которого P(X F.ОБР.ПХ() использовалась функция FРАСПОБР() .

Вышеуказанные функции можно взаимозаменять, т.к. следующие формулы возвращают одинаковый результат: =F.ОБР(0,05;k1;k2) =F.ОБР.ПХ(1-0,05;k1;k2) = FРАСПОБР (1-0,05;k1;k2)

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье Распределения случайной величины в MS EXCEL .

Функция ФИШЕР в Excel и примеры ее работы

Функция ФИШЕР выполняет возвращение преобразования Фишера для аргументов X . Это преобразование строит функцию, которая имеет нормальное, а не асимметричное распределение. Используется функция ФИШЕР для того чтобы проверить гипотезу с помощью коэффициента корреляции.

Описание работы функции ФИШЕР в Excel

При работе с данной функцией необходимо задать значение переменной. Сразу стоит отметить, что существуют некоторые ситуации, при которых данная функция не будет выдавать результатов. Это возможно, если переменная:

  • не является числом. В такой ситуации функция ФИШЕР осуществит возвращение значения ошибки #ЗНАЧ!;
  • имеет значение либо меньше -1, либо больше 1. В данном случае функция ФИШЕР возвратит значение ошибки #ЧИСЛО!.

Уравнение, которое используется для математического описания функции ФИШЕР, имеет вид:

Рассмотрим применение данной функции на 3-x конкретных примерах.

Оценка взаимосвязи прибыли и затрат по функции ФИШЕР

Пример 1. Используя данные об активности коммерческих организаций, требуется сделать оценку связи прибыли Y (млн руб.) и затрат X (млн руб.), используемых для разработки продукции (приведены в таблице 1).

Читать еще:  Метод иерархий в excel

Таблица 1 – Исходные данные:

XY
1210 000 000,00 ₽95 000 000,00 ₽
21 068 000 000,00 ₽76 000 000,00 ₽
31 005 000 000,00 ₽78 000 000,00 ₽
4610 000 000,00 ₽89 000 000,00 ₽
5768 000 000,00 ₽77 000 000,00 ₽
6799 000 000,00 ₽85 000 000,00 ₽

Схема решения таких задач выглядит следующим образом:

  1. Рассчитывается линейный коэффициент корреляции rxy;
  2. Проверяется значимость линейного коэффициента корреляции на основе t-критерия Стьюдента. При этом выдвигается и проверяется гипотеза о равенстве коэффициента корреляции нулю. При проверке этой гипотезы используется t-статистика. Если гипотеза подтверждается, t-статистика имеет распределение Стьюдента. Если расчетное значение tр > tкр, то гипотеза отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между Х и Y;
  3. Определяется интервальная оценка для статистически значимого линейного коэффициента корреляции.
  4. Определяется интервальная оценка для линейного коэффициента корреляции на основе обратного z-преобразования Фишера;
  5. Рассчитывается стандартная ошибка линейного коэффициента корреляции.

Результаты решения данной задачи с применяемыми функциями в пакете Excel приведены на рисунке 1.

Рисунок 1 – Пример расчетов.

№ п/пНаименование показателяФормула расчета
1Коэффициент корреляции=КОРРЕЛ(B2:B7;C2:C7)
2Расчетное значение t-критерия tp=ABS(C8)/КОРЕНЬ(1-СТЕПЕНЬ(C8;2))*КОРЕНЬ(6-2)
3Табличное значение t-критерия trh=СТЬЮДРАСПОБР(0,05;4)
4Табличное значение стандартного нормального распределения zy=НОРМСТОБР((0,95+1)/2)
5Значение преобразования Фишера z’=ФИШЕР(C8)
6Левая интервальная оценка для z=C12-C11*КОРЕНЬ(1/(6-3))
7Правая интервальная оценка для z=C12+C11*КОРЕНЬ(1/(6-3))
8Левая интервальная оценка для rxy=ФИШЕРОБР(C13)
9Правая интервальная оценка для rxy=ФИШЕРОБР(C14)
10Стандартное отклонение для rxy=КОРЕНЬ((1-C8^2)/4)

Таким образом, с вероятностью 0,95 линейный коэффициент корреляции заключен в интервале от (–0,386) до (–0,990) со стандартной ошибкой 0,205.

Проверка статистической значимости регрессии по функции FРАСПОБР

Пример 2. Произвести проверку статистической значимости уравнения множественной регрессии с помощью F-критерия Фишера, сделать выводы.

Для проверки значимости уравнения в целом выдвинем гипотезу Н о статистической незначимости коэффициента детерминации и противоположную ей гипотезу Н1 о статистической значимости коэффициента детерминации:

Проверим гипотезы с помощью F-критерия Фишера. Показатели приведены в таблице 2.

Таблица 2 – Исходные данные

ПоказательSSMSFрасч
Регрессия454,814227,4077,075
Остаток1607,01432,14
Итого2061,828

Для этого используем в пакете Excel функцию:

  • α – вероятность, связанная с данным распределением;
  • p и n – числитель и знаменатель степеней свободы, соответственно.

Зная, что α = 0,05, p = 2 и n = 53, получаем следующее значение для Fкрит (см. рисунок 2).

Рисунок 2 – Пример расчетов.

Таким образом можно сказать, что Fрасч > Fкрит. В итоге принимается гипотеза Н1 о статистической значимости коэффициента детерминации.

Расчет величины показателя корреляции в Excel

Пример 3. Используя данные 23 предприятий о: X — цена на товар А, тыс. руб.; Y — прибыль торгового предприятия, млн. руб, производится изучение их зависимости. Оценка регрессионной модели дала следующее: ∑(yi-yx) 2 = 50000; ∑(yi-yср) 2 = 130000. Какой показатель корреляции можно определить по этим данным? Рассчитайте величину показателя корреляции и, используя критерий Фишера, сделайте вывод о качестве модели регрессии.

Определим Fкрит из выражения:

где R – коэффициент детерминации, равный 0,67.

Таким образом, расчетное значение Fрасч = 46.

Для определения Fкрит используем распределение Фишера (см. рисунок 3).

Рисунок 3 – Пример расчетов.

Таким образом, полученная оценка уравнения регрессии надежна.

Табличное значение критерия фишера в excel. Точный критерий фишера

Возвращает значение, обратное (правостороннему) F-распределению вероятностей. Если p = FРАСП(x;. ), то FРАСПОБР(p;. ) = x.

F-распределение может использоваться в F-тесте, который сравнивает степени разброса двух множеств данных. Например, можно проанализировать распределение доходов в США и Канаде, чтобы определить, похожи ли эти две страны по степени плотности доходов.

Важно: Эта функция была заменена одной или несколькими новыми функциями, которые обеспечивают более высокую точность и имеют имена, лучше отражающие их назначение. Хотя эта функция все еще используется для обеспечения обратной совместимости, она может стать недоступной в последующих версиях Excel, поэтому мы рекомендуем использовать новые функции.

Чтобы узнать больше о новых функциях, см. статьи Функция F.ОБР и Функция F.ОБР.ПХ .

Синтаксис

Аргументы функции FРАСПОБР описаны ниже.

Читать еще:  Назовите функции ms excel

Вероятность — обязательный аргумент. Вероятность, связанная с интегральным F-распределением.

Степени_свободы1 — обязательный аргумент. Числитель степеней свободы.

Степени_свободы2 — обязательный аргумент. Знаменатель степеней свободы.

Замечания

Если какой-либо из аргументов не является числом, функция FРАСПОБР возвращает значение ошибки #ЗНАЧ!.

Если «вероятность» 1, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

Если значение аргумента «степени_свободы1» или «степени_свободы2» не является целым числом, оно усекается.

Если «степени_свободы1» S 2 2 . Наиболее часто используемый вариант Н А. Критическая область — верхний хвост F-распределения.

2. S 1 2 F табл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна ) .

Дисперсионный анализ

Показатели качества уравнения регрессии

Пример . По совокупности 25 предприятий торговли изучается зависимость между признаками: X — цена на товар А, тыс. руб.; Y — прибыль торгового предприятия, млн. руб. При оценке регрессионной модели были получены следующие промежуточные результаты: ∑(y i -y x) 2 = 46000; ∑(y i -y ср) 2 = 138000. Какой показатель корреляции можно определить по этим данным? Рассчитайте величину этого показателя, на основе этого результата и с помощью F-критерия Фишера сделайте вывод о качестве модели регрессии.
Решение. По этим данным можно определить эмпирическое корреляционное отношение : , где ∑(y ср -y x) 2 = ∑(y i -y ср) 2 — ∑(y i -y x) 2 = 138000 — 46000 = 92 000.
η 2 = 92 000/138000 = 0.67, η = 0.816 (0.7 Fтабл, то найденная оценка уравнения регрессии статистически надежна.

Вопрос: Какую статистику используют для проверки значимости модели регрессии?
Ответ: Для значимости всей модели в целом используют F-статистику (критерий Фишера).

Функция ФИШЕР выполняет возвращение преобразования Фишера для аргументов X . Это преобразование строит функцию, которая имеет нормальное, а не асимметричное распределение. Используется функция ФИШЕР для того чтобы проверить гипотезу с помощью коэффициента корреляции.

Описание работы функции ФИШЕР в Excel

При работе с данной функцией необходимо задать значение переменной. Сразу стоит отметить, что существуют некоторые ситуации, при которых данная функция не будет выдавать результатов. Это возможно, если переменная:

  • не является числом. В такой ситуации функция ФИШЕР осуществит возвращение значения ошибки #ЗНАЧ!;
  • имеет значение либо меньше -1, либо больше 1. В данном случае функция ФИШЕР возвратит значение ошибки #ЧИСЛО!.

Уравнение, которое используется для математического описания функции ФИШЕР, имеет вид:

Рассмотрим применение данной функции на 3-x конкретных примерах.

Оценка взаимосвязи прибыли и затрат по функции ФИШЕР

Пример 1. Используя данные об активности коммерческих организаций, требуется сделать оценку связи прибыли Y (млн руб.) и затрат X (млн руб.), используемых для разработки продукции (приведены в таблице 1).

Таблица 1 – Исходные данные:

XY
1210 000 000,00 ₽95 000 000,00 ₽
21 068 000 000,00 ₽76 000 000,00 ₽
31 005 000 000,00 ₽78 000 000,00 ₽
4610 000 000,00 ₽89 000 000,00 ₽
5768 000 000,00 ₽77 000 000,00 ₽
6799 000 000,00 ₽85 000 000,00 ₽

Схема решения таких задач выглядит следующим образом:

  1. Рассчитывается линейный коэффициент корреляции r xy ;
  2. Проверяется значимость линейного коэффициента корреляции на основе t-критерия Стьюдента. При этом выдвигается и проверяется гипотеза о равенстве коэффициента корреляции нулю. При проверке этой гипотезы используется t-статистика. Если гипотеза подтверждается, t-статистика имеет распределение Стьюдента. Если расчетное значение t р > t кр, то гипотеза отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между Х и Y;
  3. Определяется интервальная оценка для статистически значимого линейного коэффициента корреляции.
  4. Определяется интервальная оценка для линейного коэффициента корреляции на основе обратного z-преобразования Фишера;
  5. Рассчитывается стандартная ошибка линейного коэффициента корреляции.

Результаты решения данной задачи с применяемыми функциями в пакете Excel приведены на рисунке 1.

Рисунок 1 – Пример расчетов.

№ п/пНаименование показателяФормула расчета
1Коэффициент корреляции=КОРРЕЛ(B2:B7;C2:C7)
2Расчетное значение t-критерия tp=ABS(C8)/КОРЕНЬ(1-СТЕПЕНЬ(C8;2))*КОРЕНЬ(6-2)
3Табличное значение t-критерия trh=СТЬЮДРАСПОБР(0,05;4)
4Табличное значение стандартного нормального распределения zy=НОРМСТОБР((0,95+1)/2)
5Значение преобразования Фишера z’=ФИШЕР(C8)
6Левая интервальная оценка для z=C12-C11*КОРЕНЬ(1/(6-3))
7Правая интервальная оценка для z=C12+C11*КОРЕНЬ(1/(6-3))
8Левая интервальная оценка для rxy=ФИШЕРОБР(C13)
9Правая интервальная оценка для rxy=ФИШЕРОБР(C14)
10Стандартное отклонение для rxy=КОРЕНЬ((1-C8^2)/4)
Читать еще:  F критическое в excel

Таким образом, с вероятностью 0,95 линейный коэффициент корреляции заключен в интервале от (–0,386) до (–0,990) со стандартной ошибкой 0,205.

Проверка статистической значимости регрессии по функции FРАСПОБР

Пример 2. Произвести проверку статистической значимости уравнения множественной регрессии с помощью F-критерия Фишера, сделать выводы.

Для проверки значимости уравнения в целом выдвинем гипотезу Н 0 о статистической незначимости коэффициента детерминации и противоположную ей гипотезу Н 1 о статистической значимости коэффициента детерминации:

Проверим гипотезы с помощью F-критерия Фишера. Показатели приведены в таблице 2.

Таблица 2 – Исходные данные

Для этого используем в пакете Excel функцию:

  • α – вероятность, связанная с данным распределением;
  • p и n – числитель и знаменатель степеней свободы, соответственно.

Зная, что α = 0,05, p = 2 и n = 53, получаем следующее значение для F крит (см. рисунок 2).

Рисунок 2 – Пример расчетов.

Таким образом можно сказать, что F расч > F крит. В итоге принимается гипотеза Н 1 о статистической значимости коэффициента детерминации.

Расчет величины показателя корреляции в Excel

Пример 3. Используя данные 23 предприятий о: X — цена на товар А, тыс. руб.; Y — прибыль торгового предприятия, млн. руб, производится изучение их зависимости. Оценка регрессионной модели дала следующее: ∑(yi-yx) 2 = 50000; ∑(yi-yср) 2 = 130000. Какой показатель корреляции можно определить по этим данным? Рассчитайте величину показателя корреляции и, используя критерий Фишера, сделайте вывод о качестве модели регрессии.

Определим F крит из выражения:

F расч = R 2 /23*(1-R 2)

где R – коэффициент детерминации, равный 0,67.

Таким образом, расчетное значение F расч = 46.

Для определения F крит используем распределение Фишера (см. рисунок 3).

Рисунок 3 – Пример расчетов.

Таким образом, полученная оценка уравнения регрессии надежна.

Правило принятия решения при использовании критерия Фишера.

Если альтернативная гипотеза Н1: > , то по таблице критических точек распределения Фишера (или вычисляется в Excel) для заданного уровня значимости a и чисел степеней свободы распределения Фишера, равных

где nх и nу — объемы выборок, находится критическая точка распределения Фишера Fa(kх, kу) правосторонней критической области. Это значение сравнивается с наблюдаемым значением критерия Фишера:

· если

· в поле Альфа установить уровень значимости (по умолчанию установлено a=0,05);

· в группе Параметры вывода, если вы хотите вывести результаты вычислений на текущем рабочем листе этого файла, то необходимо активизировать переключатель Выходной интервал и указать его адрес в поле справа;

· если вы хотите вывести результаты вычислений на другой рабочий лист, то следует активизировать переключатель Новый рабочий лист и ввести его адрес в поле справа;

· если вы хотите вывести результаты вычислений в новый файл, то следует активизировать переключатель Новая рабочая книга.

После того, как установлены все необходимые параметры, следует закрыть диалоговое окно нажатием на ОК.

В результате появится таблица, в которой будут содержаться вычисленные выборочные средние, дисперсии, для каждой выборки: число степеней свободы (4.2) для каждой выборки (в строке: df), наблюдаемое значение критерия Фишера (4.1) (в строке: F), вероятность того, что наблюдаемое значение критерия будет меньше критической точки односторонней критической области (в строке: Р(F Fa, то нет оснований отвергнуть основную гипотезу;

· если

§5.3. Критерий Стьюдента (t-тест) сравнения выборочных средних двух независимых выборок

Критерий Стьюдента.

Пусть из двух генеральных совокупностей Х и Y, имеющих распределение, близкое к нормальному, извлечено по одной независимой выборке. Вычисленные по этим выборкам средние значения и , как правило, различаются. В силу случайности выборки это различие может быть случайным, и генеральные средние и могут совпадать.

Требуется проверить основную гипотезу Н: = . Значимость различия между двумя выборочными средними и определяется с помощью критерия Стьюдента (или tкритерия).

Наблюдаемое значение критерия Стьюдента вычисляется по формуле:

, (4.3)

где величина называется ошибкой разности выборочных средних. Вычисление зависит от объемов выборок и того, предполагаются ли равными или нет неизвестные дисперсии генеральных совокупностей:

· если объемы выборок nх и nу примерно одинаковые и достаточно большие, т.е. nх>30 и nу>30, то

,

где и – дисперсии выборок из двух генеральных совокупностей Х и Y;

Последнее изменение этой страницы: 2016-09-13; Нарушение авторского права страницы

Ссылка на основную публикацию
Adblock
detector