Oc-windows.ru

IT Новости из мира ПК
19 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Уровень надежности в excel

Применение описательной статистики в Microsoft Excel

Пользователи Эксель знают, что данная программа имеет очень широкий набор статистических функций, по уровню которых она вполне может потягаться со специализированными приложениями. Но кроме того, у Excel имеется инструмент, с помощью которого производится обработка данных по целому ряду основных статистических показателей буквально в один клик.

Этот инструмент называется «Описательная статистика». С его помощью можно в очень короткие сроки, использовав ресурсы программы, обработать массив данных и получить о нем информацию по целому ряду статистических критериев. Давайте взглянем, как работает данный инструмент, и остановимся на некоторых нюансах работы с ним.

Использование описательной статистики

Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.

В Экселе существует отдельный инструмент, входящий в «Пакет анализа», с помощью которого можно провести данный вид обработки данных. Он так и называется «Описательная статистика». Среди критериев, которые высчитывает данный инструмент следующие показатели:

  • Медиана;
  • Мода;
  • Дисперсия;
  • Среднее;
  • Стандартное отклонение;
  • Стандартная ошибка;
  • Асимметричность и др.

Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.

Подключение «Пакета анализа»

Как уже было сказано выше, инструмент «Описательная статистика» входит в более широкий набор функций, который принято называть Пакет анализа. Но дело в том, что по умолчанию данная надстройка в Экселе отключена. Поэтому, если вы до сих пор её не включили, то для использования возможностей описательной статистики, придется это сделать.

  1. Переходим во вкладку «Файл». Далее производим перемещение в пункт «Параметры».

В активировавшемся окне параметров перемещаемся в подраздел «Надстройки». В самой нижней части окна находится поле «Управление». Нужно в нем переставить переключатель в позицию «Надстройки Excel», если он находится в другом положении. Вслед за этим жмем на кнопку «Перейти…».

  • Запускается окно стандартных надстроек Excel. Около наименования «Пакет анализа» ставим флажок. Затем жмем на кнопку «OK».
  • После вышеуказанных действий надстройка Пакет анализа будет активирована и станет доступной во вкладке «Данные» Эксель. Теперь мы сможем использовать на практике инструменты описательной статистики.

    Применение инструмента «Описательная статистика»

    Теперь посмотрим, как инструмент описательная статистика можно применить на практике. Для этих целей используем готовую таблицу.

      Переходим во вкладку «Данные» и выполняем щелчок по кнопке «Анализ данных», которая размещена на ленте в блоке инструментов «Анализ».

    Открывается список инструментов, представленных в Пакете анализа. Ищем наименование «Описательная статистика», выделяем его и щелкаем по кнопке «OK».

    После выполнения данных действий непосредственно запускается окно «Описательная статистика».

    В поле «Входной интервал» указываем адрес диапазона, который будет подвергаться обработке этим инструментом. Причем указываем его вместе с шапкой таблицы. Для того, чтобы внести нужные нам координаты, устанавливаем курсор в указанное поле. Затем, зажав левую кнопку мыши, выделяем на листе соответствующую табличную область. Как видим, её координаты тут же отобразятся в поле. Так как мы захватили данные вместе с шапкой, то около параметра «Метки в первой строке» следует установить флажок. Тут же выбираем тип группирования, переставив переключатель в позицию «По столбцам» или «По строкам». В нашем случае подходит вариант «По столбцам», но в других случаях, возможно, придется выставить переключатель иначе.

    Выше мы говорили исключительно о входных данных. Теперь переходим к разбору настроек параметров вывода, которые расположены в этом же окне формирования описательной статистики. Прежде всего, нам нужно определиться, куда именно будут выводиться обработанные данные:

    В первом случае нужно указать конкретный диапазон на текущем листе или его верхнюю левую ячейку, куда будет выводиться обработанная информация. Во втором случае следует указать название конкретного листа данной книги, где будет отображаться результат обработки. Если листа с таким наименованием в данный момент нет, то он будет создан автоматически после того, как вы нажмете на кнопку «OK». В третьем случае никаких дополнительных параметров указывать не нужно, так как данные будут выводиться в отдельном файле Excel (книге). Мы выбираем вывод результатов на новом рабочем листе под названием «Итоги».

    Далее, если вы хотите чтобы выводилась также итоговая статистика, то нужно установить флажок около соответствующего пункта. Также можно установить уровень надежности, поставив галочку около соответствующего значения. По умолчанию он будет равен 95%, но его можно изменить, внеся другие числа в поле справа.

    Кроме этого, можно установить галочки в пунктах «K-ый наименьший» и «K-ый наибольший», установив значения в соответствующих полях. Но в нашем случае этот параметр так же, как и предыдущий, не является обязательным, поэтому флажки мы не ставим.

    После того, как все указанные данные внесены, жмем на кнопку «OK».

    После выполнения этих действий таблица с описательной статистикой выводится на отдельном листе, который был нами назван «Итоги». Как видим, данные представлены сумбурно, поэтому их следует отредактировать, расширив соответствующие колонки для более удобного просмотра.

  • После того, как данные «причесаны» можно приступать к их непосредственному анализу. Как видим, при помощи инструмента описательной статистики были рассчитаны следующие показатели:
    • Асимметричность;
    • Интервал;
    • Минимум;
    • Стандартное отклонение;
    • Дисперсия выборки;
    • Максимум;
    • Сумма;
    • Эксцесс;
    • Среднее;
    • Стандартная ошибка;
    • Медиана;
    • Мода;
    • Счет.
  • Если какие-то из вышеуказанных данных для конкретного вида анализа не нужны, то их можно удалить, чтобы они не мешали. Далее производится анализ с учетом статистических закономерностей.

    Как видим, с помощью инструмента «Описательная статистика» можно сразу получить результат по целому ряду критериев, которые в ином случае рассчитывались с применением отдельно предназначенной для каждого расчета функцией, что заняло бы значительное время у пользователя. А так, все эти расчеты можно получить практически в один клик, использовав соответствующий инструмент — Пакета анализа.

    Отблагодарите автора, поделитесь статьей в социальных сетях.

    Уровень надежности в excel

    цитата: Akina:
    Сервис — Надстройки — Пакет аналдиза — Описательный анализ.
    ?

    это в 2007 где?
    в 2003 нашел, что дальше делать не пойму

    3. Akina , 17.08.2009 13:26
    999exp999
    это в 2007 где?
    что дальше делать не пойму
    Сходи и купи себе новую клавиатуру — на которой есть кнопка F1.

    цитата: Akina:
    999exp999
    это в 2007 где?
    что дальше делать не пойму
    Сходи и купи себе новую клавиатуру — на которой есть кнопка F1.

    функции в описательном анализе не те.
    Или те, но я не знаю, как их использовать. Помогите кто может.

    4. 999exp999 , 19.08.2009 12:17
    5. V3 , 19.08.2009 16:14
    999exp999
    Похоже Вы неправильно формулируете задачу.
    Нельзя подсчитать «среднее значения ряда чисел с заданной доверительной вероятностью», правильно это дожно звучать так:
    нужно определить границы 95% (85%) — ного доверительного интервала для среднего значения.

    Решение данной задачи следующее:
    1. Есть выборка чисел (вводим в столбец А например А1:А20)
    2. Сервис — Анализ данных — Описательная статистика
    3. В диалоговом окне
    «Входной интервал» указываем А1:А20
    Активизируем переключатель «Выходной интервал» указываем ячейку (например В1)
    В разделе группировка переключатель должен стоять «по столбцам»
    Устанавливаем флажок в левое поле «Уровень надежности» и в правом поле (%) вводим 95 (или 85).
    Нажимаем ОК
    4. В результате анализа в указанном выходном диапазоне для доверительной вероятности 0,95 (0,85) получаем значения доверительного интервала

    Вообще не в обиду Вам будет сказано возьмите хелп не для Excel, а по мат статистике и разберитесь в теории
    Немного для прояснения вопроса
    Уровень надежности — это половина доверительного интервала для генерального среднего арифметического. Из полученного результата следует, что с вероятностью 0,95 (0,85) среднее арифметическое для генеральной совокупности находится в интервале ВЫБОРОЧНОЕ СРЕДНЕЕ +/- ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ.
    Само же выборочное среднее (М) находится обычно или с помощью функции СРЗНАЧ или процедурой Описательной статистики одновременно с доверительным интервалом.

    Бывает нужно еще находить доверительные границы для «выскакивающего среднего» (эта задача обычно ходит парой с доверительным интервалом для среднего) данный вопрос Вы не поднимали, но если нужно могу написать и про это.

    да, в статистике я дуб, но приходится решать такую задачу.
    Специфика моей работы такова, что эти расчётные значения раньше я просто считал в уме, проверить исходные данные невозможно, наука не точная (геология), поэтому при большом разбросе занижал расчётные значения по сравнению с нормативными (средними) на 30%, при малом на 5-10%
    Сделал сейчас вот так:
    1. считаю стандатрное отклонение СТАНДОТКЛ
    2. считаю ДОВЕРИТ
    3. СРЗНАЧ-ДОВЕРИТ=искомое значение
    Значения получил примерно те, что ожидал
    ряд 0,026
    0,017
    0,021
    0,021
    0,024
    0,040
    0,039
    среднее 0,027
    расчетное при доверительной вероятности 0,85 0,022
    при 0,95 0,020
    Правильно?

    6. 999exp999 , 20.08.2009 08:42
    7. Akina , 20.08.2009 10:51
    999exp999
    ряд
    0,026
    0,017
    0,021
    0,021
    0,024
    0,040
    0,039

    неужели физика процесса допускает такие выбросы? получается, что НИ ОДНО из значений не ложится в доверительный интервал. бред какой-то.
    8. V3 , 20.08.2009 16:14
    Akina
    НИ ОДНО из значений не ложится в доверительный интервал
    Как так?
    смотрите среднее значение 0,027 доверительный интервал будет (если правильно автор сделал расчет) от 0,027-0,020 до 0,027+0,020, т.е. (0,07;0,047) в него уложатся все значения (от 0,017 до 0,040). (Но расчеты неверные).

    999exp999
    Таааак
    ну расчет неверен, у Вас к сожалению полный сумбур. Сейчас собирусь с духом и напишу развернутый ответ.
    Вот только объясните что это за данные. Т.е. меряется в одном месте чегото (скажем содержание какого то изотопа).
    Дальше нужно сравнить с каким нибудь статистическим распределением?
    Что то мне страшно становится за нашу геологоразведку.

    9. Akina , 20.08.2009 16:22
    V3
    Как так?
    Элементарная невнимательность. я как-то привык, что доверительный интервал отличается от среднего хотя бы в разы. ну и воображение пририсовало ещё один нолик.
    10. V3 , 20.08.2009 18:48
    Akina
    Да вообще набор данных странноват отличие максимального от минимального более чем в 2 раза.

    999exp999
    Начнем по порядку
    сперва с ошибок которые Вы натворили
    1. Я уже писал в предыдущем посте среднее может быть только одно, оно не зависит от границ х% — ного доверительного интервала. Задавая доверетильную вероятност Вы изменяете границы доверетильного интервала.
    2. Постарайтесь понят что Вы хотите сделать, потому что пока это похоже на то что просто применяете набор формул с целью получить какоето число.

    Попытаюсь объяснить как я понимаю данную задачу.
    Есть генеральная совокупность (например в данном случае «бесконечное» число измерений процентного содержания изотопа в данном районе, т.е. как бы это сказать это число замеров в КАЖДОЙ точке района. Конечно же столько замеров нельзя сделать это пришлось бы проводить замер на каждом кв см.), из данной выборки взяты варианты (варианта — одно из данных генеральной совокупности. т.е. скажем в данном районе было произведено 7 замеров в различных местах) получили выборку.
    Теперь анализируя данную выборку нужно ответить на вопрос «Можно ли по результатам выборочной оценки судить о свойствах всей генеральной совокупности». Например «значимо ли отличие выборочного среднего значения от среднего значения генеральной совокупности, из которой предположительно взята выборка, или наблюдаемое различие является случайным».

    Добавление от 20.08.2009 19:10:

    Если это действительно экспериментальные данные геологоразведки, то вроде должны они делатся следующим образом, ставим прибор на точку замера и снимаем параметр несколько раз (я думаю не меньше трех должно быть). Поправте меня если ошибаюсь (геологоразведкой не занимался).
    Таким образом должна получится таблица скажем что то типа 7 точек в каждой из которых по три замера. Эти три замера должны быть усреднены.
    Это означает что в случае средних арифметических значений выборочных средних относительно генерального среднего распределяются по нормальному закону. Так же как относительные отклонения нормально распределенных вариант от среднего выборки.
    Отсюда встает вопрос Ваши 7 приведенных чисел это средние арифметические замеров или же какойто другой набор чисел

    11. V3 , 20.08.2009 20:11
    Границы доверительного интервала определяются формулой

    где М — среднее значение, s — стандартное отклонение, t п.р — табличное значение распределения Стьюдента с числом степеней свободы n и доверительной вероятностью р, n — количество элементов в выборке.
    В Excel для точного вычисления границ доверительного интервала и при числе элементов в выборке К сообщению приложены файлы: 1.png, 240×74, 1Кb

    12. 999exp999 , 20.08.2009 20:14
    Не видел предудущего вашего сообщения, сейчас почитаю

    Этот набор из 7 чисел — результаты испытания на прочность (значение удельного сцепления в мегапаскалях) 7 разных образцов грунта, взятых из одного массива. Разброс на самом деле нормальный, бывает и более чем двукратный, грунт — разнородный материал, это в порядке вещей.
    Нормативное значение — это среднее арифметическое частных значений (в данном случае их 7).
    Расчётное значение с коэффициентом доверительной вероятности 0,85 — должно быть таким, при котором 85% частных значений будет выше него или равно ему.
    То есть при 100 исходных данных — 16 худший результат — это расчётное значение при альфа=0,85. Здесь проблем нет. Они начинаются, когда частных значений мало, обычно бывает от 6 до 15.

    Добавление от 20.08.2009 20:20:

    Результат:
    С 95% — ным уровнем надежности можно утверждать, что средняя величина составляет 0,0269 +/- 0,00673 или от 0,0201 до 0,0336

    (аналогично можно вычислить для 85% вероятности)
    Обратите внимание что альфа используемая в формуле это не 0,95, а 1-0,95=0,05

    Вот приблизительно как то так в теории должно быть (уже пару лет статистикой не занимался)

    таки я прав. расчётная величина 0,0269-0,00673=0,0201.
    Просто я неправильно поставил вопрос, в геологии расчётное значение — не то, что подразумевается в обычной статистике

    13. V3 , 21.08.2009 05:15
    999exp999
    Правильно поставленный вопрос содержит половину ответа

    Расчётное значение с коэффициентом доверительной вероятности 0,85 — должно быть таким, при котором 85% частных значений будет выше него или равно ему.

    Вам нужно не среднее значение как Вы изначально написали, и даже похоже не нижняя граница доверительного интервала, а значение полу интервала правее которого будут лежать данные превышающие нужное значение с вероятностью 85%.
    Если я правильно Вас понял, то это немного другая задача.
    Т.к. при нахождении доверительного интервала стоит задача найти «карман» в который данные поподают с данной значимостью, а т.к. нужно все что превышает то получается Вы теряете вносимый правый интервал (от границы интервала до бесконечности). Здесь надо считать по другому

    Немного сумбурно написал, но пора убегать на работу.

    Описание статистических функций для достоверности в Excel

    Сводка

    В этой статье описывается функция ДОВЕРИТЕЛЬных СОВПАДЕНИй в Microsoft Office Excel 2003 и Microsoft Office Excel 2007, показано, как используется функция, и сравниваются результаты функции для Excel 2003 и для Excel 2007 с результатами более ранней достоверности. версиях Excel.

    Значение доверительного интервала часто ошибочно интерпретируется, и мы попробуем получить объяснение допустимых и недопустимых операторов, которые можно выполнить после определения ДОСТОВЕРНОсти данных.

    Дополнительные сведения

    Функция ДОВЕРИТ (альфа, Сигма, н) возвращает значение, которое можно использовать для создания доверительного интервала для среднего Генеральной совокупности. Доверительный интервал — это диапазон значений, которые центрируются по известной выборочной среднему значению. Наблюдение в образце предполагается из нормального распределения со стандартным отклонением, Сигма, а количество наблюдений в примере равно n.

    Синтаксис

    Параметры: альфа — вероятность и 0

    Пример использования

    Представим, что баллы для (IQ) для интеллекта должны следовать нормальному распределению со стандартным отклонением 15. Вы протестируете Икс для примера из 50 учащихся в местном учебном заведении и получите выборочное среднее арифметическое 105. Вы хотите вычислить доверительный интервал 95% для среднего Генеральной совокупности. Доверительный интервал 95% или 0,95 соответствует альфа = 1 – 0,95 = 0,05.

    Чтобы продемонстрировать функцию достоверности, создайте пустой лист Excel, Скопируйте приведенную ниже таблицу, а затем выберите ячейку a1 на пустом листе Excel. В меню Правка выберите команду Вставить.

    Примечание: В Excel 2007 нажмите кнопку Вставить в группе буфер обмена на вкладке Главная .

    Записи в таблице ниже заполняют ячейки a1: B7 на листе.

    = ДОВЕРИТ (B1; B2; B3)

    = НОРМСТОБР (1-B1/2) * B2/SQRT (B3)

    После вставки этой таблицы на новый лист Excel нажмите кнопку Параметры вставки , а затем выберите пункт в соответствии с форматированием конечногофрагмента.

    Выделив вставляемый диапазон, наведите указатель на пункт столбец в меню Формат , а затем выберите пункт Автоподбор по выделению.

    Примечание: В Excel 2007 с выделенным диапазоном ячеек в группе ячейки на вкладке Главная нажмите кнопку Формат и выберите команду Автоподбор ширины столбца.

    В ячейке A6 показано значение достоверности. В ячейке A7 показано одно и то же значение, так как при вызове метода ДОВЕРИТ (Alpha; Сигма; n) возвращаются результаты вычислений.

    NORMSINV(1 – alpha/2) * sigma / SQRT(n)

    Никаких изменений не было сделано, но функция НОРМСТОБР была улучшена в Microsoft Excel 2002, а затем в Excel 2002 и Excel 2007 было внесено больше улучшений. Таким образом, точность может возвращать другие (и улучшенные) результаты в этих более поздних версиях Excel, так как точное СОВПАДЕНИе основывается на НОРМСТОБР.

    Это не значит, что в более ранних версиях Excel вы должны потерять уверенность. Неточности в НОРМСТОБР обычно произошел для значений аргумента очень близко к 0 или очень близко к 1. На практике альфа-канал обычно имеет значение 0,05, 0,01 или, возможно, 0,001. Значения Alpha должны быть гораздо меньше, чем, например 0,0000001, до тех пор, пока не будут замечены ошибки округления в НОРМСТОБР.

    Примечание: Ознакомьтесь со статьей «НОРМСТОБР» для обсуждения различий вычислений в НОРМСТОБР.

    Чтобы получить дополнительные сведения, щелкните следующий номер статьи базы знаний Майкрософт:

    826772 Статистические функции Excel: НОРМСТОБР

    Интерпретация результатов достоверности

    Для Excel 2003 и Excel 2007 файл справки Excel обновлен, так как все предыдущие версии файла справки дали ошибочные рекомендации по интерпретации результатов. В примере «допустим, что в нашем примере для пользователей 50, средняя продолжительность поездки на работу составляет 30 минут со стандартным отклонением Генеральной совокупности 2,5. Мы можем получить 95% уверенности в том, что среднее Генеральной совокупности находится в интервале 30 +/-0,692951 «где 0,692951 — значение, возвращаемое ДОСТОВЕРНОстью (0,05, 2,5, 50).

    В этом примере «заключение» считывает «средняя продолжительность поездки на работу равняется 30 ± 0,692951 минутам или 29,3 – 30,7 минут». Предполагается, что это также является оператором для среднего Генеральной совокупности в интервале [30 – 0,692951, 30 + 0,692951] с вероятностью 0,95.

    Перед проведением эксперимента, который выдает данные для этого примера, классическое статистиЦиан (в отличие от Байесиан статистиЦиан) может не делать никаких инструкций по распространению вероятности для среднего Генеральной совокупности. Вместо этого классическое статистиЦиан работает с тестированием гипотез.

    Например, классическое статистиЦиан может попытаться выполнить двустороннее Тестирование гипотезы на основе суппоситион нормального распределения с известным стандартным отклонением (например, 2,5), определенным предварительно выбранным значением среднего значения Генеральной совокупности, μ0 и предварительно выбранный уровень значимости (например, 0,05). Результат теста будет основываться на значении наблюдаемого выборочного среднего (например, 30) и нулевой гипотезы о том, что μ0 может быть отклонено на уровне 0,05, если наблюдаемый выборочный пример был слишком далеко от μ0 в обоих направлениях. Если пустая гипотеза отклонена, то интерпретация примера означает, что все, что далеко или дальше от μ0, появлялось бы менее чем на 5% времени в рамках суппоситион, что μ0 является истинным средним Генеральной совокупности. Проведя этот тест, классическое статистиЦиан по-прежнему не может делать никаких инструкций по выборке вероятности для среднего Генеральной совокупности.

    Байесиан статистиЦиан, с другой стороны, будет начинаться с предполагаемого распределения вероятности для среднего Генеральной совокупности (именуемого распространением приори), который будет собирать экспериментальные доказательства точно так же, как и классический статистиЦиан, и использовать это свидетельство. чтобы изменить его распределение вероятности для среднего Генеральной совокупности и, таким образом, получить постериори распределение. Excel не предоставляет статистических функций, которые помогут вам Байесиан статистиЦиан. Статистические функции Excel предназначены для использования в классических статистиЦианс.

    Доверительные интервалы связаны с проверками гипотез. При использовании экспериментального свидетельства доверительный интервал делает более четким оператором для значений гипотетического математического Генеральной совокупности μ0, который бы мог бы принимать признание пустого предположения о том, что среднее Генеральной совокупности — μ0, и значения μ0, которые выдают отклонения. пустого предположения о том, что среднее Генеральной совокупности — μ0. Классическое статистиЦиан не может делать никаких инструкций о том, что среднее значение Генеральной совокупности попадает в определенный интервал времени, так как она не создает приори допущений об этом распространении и предполагается, что оно было бы обязательным, если бы оно было Используйте экспериментальные доказательства для изменения.

    Ознакомьтесь со связью между тестами и доверительными интервалами с помощью примера в начале этого раздела. Связь между ДОСТОВЕРНОстью и НОРМСТОБР, которая указана в последнем разделе, имеет следующие возможности:

    Так как выборочное среднее — 30, доверительный интервал составляет 30 +/-0,692951.

    Теперь рассмотрим двустороннюю проверку с уровнем значимости 0,05, как описано выше, которое предполагает нормальное распределение со стандартным отклонением 2,5, а также выбор размера 50 и определенного среднего значения для Генеральной совокупности, μ0. Если это среднее значение истинной Генеральной совокупности, то выборочное среднее будет получено из нормального распределения со средним значением μ0 и стандартным отклонением, 2,5/SQRT (50). Это распределение является симметричным для μ0 и вы хотите отклонить пустую гипотезу, если ABS (выборочное среднее — μ0) > какое-либо пороговое значение. Значение порогового значения может быть таким, что если μ0 является истинным средним заполнением, то есть значение выборочное среднее-μ0, превышающее эту отсечение или значение μ0 — выборочное среднее выше, чем эта отсечение, будет возникать с вероятностью 0,05/2. Это пороговое значение:

    NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONF >

    Поэтому отклоните пустую гипотезу (среднее заполнение = μ0), если выполняется одно из следующих условий:

    выборочное среднее — μ0 > 0. 692951
    0 — выборочное среднее > 0. 692951

    Поскольку выборочное среднее = 30 в нашем примере, эти два оператора становятся следующими операторами:

    30-μ0 > 0. 692951
    μ0 – 30 > 0. 692951

    Переписывая их так, чтобы только μ0 в левой части выходили следующие инструкции:

    μ0 30 + 0. 692951

    Это именно те значения μ0, которые не входят в доверительный интервал [30 – 0,692951, 30 + 0,692951]. Таким образом, доверительный интервал [30 – 0,692951, 30 + 0,692951] содержит такие значения μ0, где нулевая гипотеза, которой μ0 Генеральной совокупности, не будет отклоняться, получая пример свидетельства. Для значений μ0 за пределами этого интервала значение NULL свидетельствует о том, что основание Генеральной совокупности — μ0 было отклонено при выборке свидетельства.

    Заключения

    Неточности в более ранних версиях Excel обычно возникают для очень мелких и очень больших значений «p» в НОРМСТОБР (p). УВЕРЕННОСТЬ оцениваются с помощью вызова НОРМСТОБР (p), поэтому точность НОРМСТОБР является потенциальной проблемой для пользователей с уверенностью. Однако значения p, которые используются в упражнениях, вряд ли будут достаточно значительны для того, чтобы вызвать существенные ошибки округления в НОРМСТОБР, и производительность УВЕРЕНности не должна быть важна для пользователей какой-либо версии Excel.

    В этой статье рассказывается о том, как интерпретировать результаты УВЕРЕНности. Другими словами, мы задавали вопрос «Каково значение доверительного интервала?» Доверительные интервалы часто непонятны. К сожалению, файлы справки Excel во всех версиях Excel, более ранних, чем Excel 2003, были внесены в это неправильное понимание. Улучшен файл справки Excel 2003.

    Примечание: Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Была ли информация полезной? Для удобства также приводим ссылку на оригинал (на английском языке).

    Уровень значимости и уровень надежности в EXCEL

    Дадим определение терминам уровень надежности и уровень значимости. Покажем, как и где они используется в MS EXCEL .

    СОВЕТ : Для понимания терминов Уровень значимости и Уровень надежности потребуется знание следующих понятий:

    Уровень значимости статистического теста – это вероятность отклонить нулевую гипотезу , когда на самом деле она верна. Другими словами, это допустимая для данной задачи вероятность ошибки первого рода (type I error).

    Уровень значимости обычно обозначают греческой буквой α ( альфа ). Чаще всего для уровня значимости используют значения 0,001; 0,01; 0,05; 0,10.

    Например, при построении доверительного интервала для оценки среднего значения распределения , его ширину рассчитывают таким образом, чтобы вероятность события « выборочное среднее (Х ср ) находится за пределами доверительного интервала » было равно уровню значимости . Реализация этого события считается маловероятным (практически невозможным) и служит основанием для отклонения нулевой гипотезы о равенстве среднего заданному значению .

    Ошибка первого рода часто называется риском производителя. Это осознанный риск, на который идет производитель продукции, т.к. он определяет вероятность того, что годная продукция может быть забракована, хотя на самом деле она таковой не является. Величина ошибки первого рода задается перед проверкой гипотезы , таким образом, она контролируется исследователем напрямую и может быть задана в соответствии с условиями решаемой задачи.

    Чрезмерное уменьшение уровня значимости α (т.е. вероятности ошибки первого рода ) может привести к увеличению вероятности ошибки второго рода , то есть вероятности принять нулевую гипотезу , когда на самом деле она не верна. Подробнее об ошибке второго рода см. статью Ошибка второго рода и Кривая оперативной характеристики .

    Уровень значимости обычно указывается в аргументах обратных функций MS EXCEL для вычисления квантилей соответствующего распределения: НОРМ.СТ.ОБР() , ХИ2.ОБР() , СТЬЮДЕНТ.ОБР() и др. Примеры использования этих функций приведены в статьях про проверку гипотез и про построение доверительных интервалов .

    Уровень надежности

    Уровень доверия (этот термин более распространен в отечественной литературе, чем Уровень надежности ) — означает вероятность того, что доверительный интервал содержит истинное значение оцениваемого параметра распределения.

    Уровень доверия равен 1-α, где α – уровень значимости .

    Термин Уровень надежности имеет синонимы: уровень доверия, коэффициент доверия, доверительный уровень и доверительная вероятность (англ. Confidence Level , Confidence Coefficient ).

    В математической статистике обычно используют значения уровня доверия 90%; 95%; 99%, реже 99,9% и т.д.

    Например, Уровень доверия 95% означает, что событие, вероятность которого 1-0,95=5% исследователь считать маловероятным или невозможным. Разумеется, выбор уровня доверия полностью зависит от исследователя. Так, степень доверия авиапассажира к надежности самолета, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки.

    Примечание : Стоит отметить, что математически не корректно говорить, что Уровень доверия является вероятностью, того что оцениваемый параметр распределения принадлежит доверительному интервалу , вычисленному на основе выборки . Поскольку, считается, что в математической статистике отсутствуют априорные сведения о параметре распределения. Математически правильно говорить, что доверительный интервал , с вероятностью равной Уровню доверия, накроет истинное значение оцениваемого параметра распределения.

    Уровень надежности в MS EXCEL

    В MS EXCEL Уровень надежности упоминается в надстройке Пакет анализа . После вызова надстройки, в диалоговом окне необходимо выбрать инструмент Описательная статистика .

    После нажатия кнопки ОК будет выведено другое диалоговое окно.

    В этом окне задается Уровень надежности, т.е.значениевероятности в процентах. После нажатия кнопки ОК в выходном интервале выводится значение равное половине ширины доверительного интервала . Этот доверительный интервал используется для оценки среднего значения распределения, когда дисперсия не известна (подробнее см. статью про доверительный интервал ).

    Необходимо учитывать, что данный доверительный интервал рассчитывается при условии, что выборка берется из нормального распределения . Но, на практике обычно принимается, что при достаточно большой выборке (n>30), доверительный интервал будет построен приблизительно правильно и для распределения, не являющегося нормальным (если при этом это распределение не будет иметь сильной асимметрии ).

    Примечание : Понять, что в диалоговом окне речь идет именно об оценке среднего значения распределения , достаточно сложно. Хотя в английской версии диалогового окна это указано прямо: Confidence Level for Mean .

    Если Уровень надежности задан 95%, то надстройка Пакет анализа использует следующую формулу (выводится не сама формула, а лишь ее результат):

    или эквивалентную ей

    где =СТАНДОТКЛОН.В(Выборка)/КОРЕНЬ(СЧЁТ(Выборка)) – является стандартной ошибкой среднего (формулы приведены в файле примера ).

    =ДОВЕРИТ.СТЬЮДЕНТ(1-0,95; СТАНДОТКЛОН.В(Выборка); СЧЁТ(Выборка))

    Читать еще:  Таблица ms excel
    Ссылка на основную публикацию
    Adblock
    detector