Oc-windows.ru

IT Новости из мира ПК
4 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Что такое входной интервал в excel

Иллюстрированный самоучитель по Microsoft Excel

Статистический анализ данных

После окончания загрузки в списке опций пункта Сервис основного меню появится строка Анализ данных. При выборе этой строки появляется окно диалога Анализ данных.

В окне диалога Анализ данных отображается список инструментов. Приведем полный список инструментов пакета анализа:

  • однофакторный дисперсионный анализ;
  • двухфакторный дисперсионный анализ с повторениями;
  • двухфакторный дисперсионный анализ без повторений;
  • корреляция;
  • ковариация;
  • описательная статистика;
  • экспоненциальное сглаживание;
  • двухвыборочный F-тест;
  • t-Тест: двухвыборочный с одинаковыми дисперсиями;
  • t-Tecr. двухвыборочный с неодинаковыми дисперсиями;
  • t-Тест: парный двухвыборочный для средних;
  • z-Тест: двухвыборочный для средних;
  • гистограмма;
  • скользящее среднее;
  • генерация случайных чисел;
  • ранг и персентиль;
  • регрессия;
  • анализ Фурье;
  • создание выборки.

Во многих инструментах статистического анализа есть одинаковые параметры. К ним относятся следующие:

  • входной интервал. Нужно ввести ссылку на интервал данных рабочего листа, подлежащих анализу. Если во входной интервал Вы включаете метки, необходимо установить флажок Метки, в противном случае Excel выдаст предупреждающее сообщение;
  • метки. Если входной интервал не включает меток, снимите флажок Метки. Excel генерирует соответствующие метки данных для выходной таблицы (Строка 1, Строка 2, Строка3 или Столбец 1, Столбец 2, Столбец 3, и т. д.);
  • выходной интервал. Введите ссылку для верхней левой ячейки интервала, в который Вы предполагаете вывести результирующую таблицу;
  • новый рабочий лист. Этот параметр вставляет новый лист в рабочую книгу, где располагается текущий рабочий лист, и вставляет результаты в ячейку А1 нового листа. Используйте поле ввода рядом с параметром для задания имени нового листа;
  • новая рабочая книга. Этот параметр создает новую рабочую книгу, добавляет новый рабочий лист в рабочую книгу и вставляет результаты в ячейку А1 нового листа.

Так, например, инструмент Описательная статистика выводит на экран статистический отчет для входных данных. Статистические данные из этой таблицы могут указать, какие тесты являются наиболее подходящими для дальнейшего анализа.

Более подробную информацию о пакете анализа можно получить из справочной системы Excel.

Статистический анализ в Excel

Встроенные статистические функции используются для проведения статистического анализа данных.

Функция СРЗНАЧ вычисляет среднее арифметическое значение. Она игнорирует пустые, логические и текстовые ячейки и может использоваться вместо длинных формул. Например, для вычисления среднего значения данных в диапазоне ячеек В4:В15 можно использовать формулу:

Очевидно, что проще ввести = СРЗНАЧ(B4:B15).

Функция МЕДИАНА вычисляет медиану множества числовых значений.

Функция МОДА определяет значение, которое чаще других встречается во множестве чисел.

Функция МАКС вычисляет наибольшее значение в диапазоне.

Функция МИН вычисляет наименьшее значение в диапазоне.

Функция СЧЕТ определяет количество ячеек в заданном диапазоне, которые содержат числа, в том числе, даты и формулы, возвращающие числа.

Функции ДИСП и СТАНДОТКЛОН определяют дисперсию и стандартное отклонение чисел, в предположении что они образуют выборку.

Функции ДИСПР и СТАНДОТКЛОНП определяют дисперсию и стандартное отклонение для генеральной совокупности.

Функция НАКЛОН вычисляет коэффициент наклона линии линейной регрессии.

Функция ОТРЕЗОК вычисляет отрезок, отсекаемый на оси линией линейной регрессии.

Функция ПРЕДСКАЗ вычисляет теоретические значения y по линии линейной регрессии.

7.2.Надстройка Анализ данных

Если встроенных статистических функций недостаточно, можно обратиться к Пакету анализа .

Чтобы получить доступ к инструментам Пакета анализа необходимо:

· выполнить команду Сервис/Анализ данных;

· для использования инструмента анализа, выбрать его имя в списке и нажать кнопку ОК;

· заполнить открывшееся диалоговое окно (в большинстве случаев это означает задание входного диапазона с данными, которые вы собираетесь анализировать, указание верхней левой ячейки выходного диапазона, в который должны быть помещены результаты, и выбор нужных параметров. Группирование: установить переключатель в положение По столбцам или По строкам в зависимости от расположения данных во входном диапазоне. Установить переключатель в положение Метки в первой строке, если первая строка во входном диапазоне содержит названия столбцов или установить переключатель в положение Метки в первом столбце, если названия строк находятся в первом столбце входного диапазона. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически).

Читать еще:  Символ рубля в excel

Если надстройка Анализ данных отсутствует, то ее можно подключить с помощью команды Сервис/Надстройки/Пакет анализа VBA ( Analysis ToolPak VBA ).

К инструментам Пакета анализа , например, относятся Описательная статистика , Корреляция , Регрессия .

Инструмент Описательная статистика предлагает таблицу основных статистических характеристик для одного или нескольких множеств входных значений ( Рис. 7.1 ):

Выходной интервал этого инструмента содержит следующие статистические характеристики: среднее, стандартная ошибка, медиана, мода, стандартное отклонение, дисперсия, коэффициент эксцесса, коэффициент асимметрии, интервал (размах), минимальное значение, максимальное значение, сумма, число значений, k -е наибольшее и наименьшее значения (для любого заданного значения k ) и уровень значимости для среднего. Установить флажок Итоговая статистика, если нужен полный список характеристик, в противном случае отметить конкретные характеристики, которые должны присутствовать в выходной таблице. Большинство из полученных характеристик, полученных с помощью пакета анализа Описательная статистика можно получить с помощью встроенных статистических формул.

Рис. 7 . 1 Диалоговое окно Описательная статистика

Корреляция используется для количественной оценки взаимосвязи двух наборов данных, представленных в безразмерном виде. Корреляционный анализ дает возможность установить, ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), или данные двух диапазонов никак не связаны (корреляция близка к нулю). В диалоговом окне Корреляция ( REF _Ref12174106 h * MERGEFORMAT Рис. 7.2 ) указывается Входной интервал – ссылка на диапазон, содержащий анализируемые данные. Ссылка должна состоять как минимум из двух смежных диапазонов данных, организованных в виде столбцов или строк.

Рис. 7 . 2 Диалоговое окно Корреляция

Регрессия используется для подбора графика линии регрессии. Параметры диалогового окна Регрессия ( Рис. 7.3 ):

Входной интервал Y – ссылка на диапазон анализируемых зависимых данных (диапазон должен состоять из одного столбца). Входной интервал X – ссылка на диапазон независимых данных, подлежащих анализу. Уровень надежности – установить флажок, чтобы включить в выходной диапазон дополнительный уровень. В соответствующее поле ввести уровень надежности, который будет использован дополнительно к уровню 95%, применяемому по умолчанию. Константа-ноль – установить флажок, чтобы линия регрессии прошла через начало координат. Остатки – установить флажок, чтобы включить остатки в выходной диапазон. Стандартизированные остатки – установить флажок, чтобы включить стандартизированные остатки в выходной диапазон. График остатков – установить флажок, чтобы построить диаграмму остатков для каждой независимой переменной. График подбора – установить флажок, чтобы построить диаграммы наблюдаемых и предсказанных значений для каждой независимой переменной. График нормальной вероятности – установить флажок, чтобы построить диаграмму нормальной вероятности.

Применение описательной статистики в Microsoft Excel

Пользователи Эксель знают, что данная программа имеет очень широкий набор статистических функций, по уровню которых она вполне может потягаться со специализированными приложениями. Но кроме того, у Excel имеется инструмент, с помощью которого производится обработка данных по целому ряду основных статистических показателей буквально в один клик.

Этот инструмент называется «Описательная статистика». С его помощью можно в очень короткие сроки, использовав ресурсы программы, обработать массив данных и получить о нем информацию по целому ряду статистических критериев. Давайте взглянем, как работает данный инструмент, и остановимся на некоторых нюансах работы с ним.

Использование описательной статистики

Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.

В Экселе существует отдельный инструмент, входящий в «Пакет анализа», с помощью которого можно провести данный вид обработки данных. Он так и называется «Описательная статистика». Среди критериев, которые высчитывает данный инструмент следующие показатели:

  • Медиана;
  • Мода;
  • Дисперсия;
  • Среднее;
  • Стандартное отклонение;
  • Стандартная ошибка;
  • Асимметричность и др.
Читать еще:  Видеоредактор для монтажа видео онлайн

Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.

Подключение «Пакета анализа»

Как уже было сказано выше, инструмент «Описательная статистика» входит в более широкий набор функций, который принято называть Пакет анализа. Но дело в том, что по умолчанию данная надстройка в Экселе отключена. Поэтому, если вы до сих пор её не включили, то для использования возможностей описательной статистики, придется это сделать.

  1. Переходим во вкладку «Файл». Далее производим перемещение в пункт «Параметры».

В активировавшемся окне параметров перемещаемся в подраздел «Надстройки». В самой нижней части окна находится поле «Управление». Нужно в нем переставить переключатель в позицию «Надстройки Excel», если он находится в другом положении. Вслед за этим жмем на кнопку «Перейти…».

  • Запускается окно стандартных надстроек Excel. Около наименования «Пакет анализа» ставим флажок. Затем жмем на кнопку «OK».
  • После вышеуказанных действий надстройка Пакет анализа будет активирована и станет доступной во вкладке «Данные» Эксель. Теперь мы сможем использовать на практике инструменты описательной статистики.

    Применение инструмента «Описательная статистика»

    Теперь посмотрим, как инструмент описательная статистика можно применить на практике. Для этих целей используем готовую таблицу.

      Переходим во вкладку «Данные» и выполняем щелчок по кнопке «Анализ данных», которая размещена на ленте в блоке инструментов «Анализ».

    Открывается список инструментов, представленных в Пакете анализа. Ищем наименование «Описательная статистика», выделяем его и щелкаем по кнопке «OK».

    После выполнения данных действий непосредственно запускается окно «Описательная статистика».

    В поле «Входной интервал» указываем адрес диапазона, который будет подвергаться обработке этим инструментом. Причем указываем его вместе с шапкой таблицы. Для того, чтобы внести нужные нам координаты, устанавливаем курсор в указанное поле. Затем, зажав левую кнопку мыши, выделяем на листе соответствующую табличную область. Как видим, её координаты тут же отобразятся в поле. Так как мы захватили данные вместе с шапкой, то около параметра «Метки в первой строке» следует установить флажок. Тут же выбираем тип группирования, переставив переключатель в позицию «По столбцам» или «По строкам». В нашем случае подходит вариант «По столбцам», но в других случаях, возможно, придется выставить переключатель иначе.

    Выше мы говорили исключительно о входных данных. Теперь переходим к разбору настроек параметров вывода, которые расположены в этом же окне формирования описательной статистики. Прежде всего, нам нужно определиться, куда именно будут выводиться обработанные данные:

    В первом случае нужно указать конкретный диапазон на текущем листе или его верхнюю левую ячейку, куда будет выводиться обработанная информация. Во втором случае следует указать название конкретного листа данной книги, где будет отображаться результат обработки. Если листа с таким наименованием в данный момент нет, то он будет создан автоматически после того, как вы нажмете на кнопку «OK». В третьем случае никаких дополнительных параметров указывать не нужно, так как данные будут выводиться в отдельном файле Excel (книге). Мы выбираем вывод результатов на новом рабочем листе под названием «Итоги».

    Далее, если вы хотите чтобы выводилась также итоговая статистика, то нужно установить флажок около соответствующего пункта. Также можно установить уровень надежности, поставив галочку около соответствующего значения. По умолчанию он будет равен 95%, но его можно изменить, внеся другие числа в поле справа.

    Кроме этого, можно установить галочки в пунктах «K-ый наименьший» и «K-ый наибольший», установив значения в соответствующих полях. Но в нашем случае этот параметр так же, как и предыдущий, не является обязательным, поэтому флажки мы не ставим.

    Читать еще:  Как прописать формулу суммы в excel

    После того, как все указанные данные внесены, жмем на кнопку «OK».

    После выполнения этих действий таблица с описательной статистикой выводится на отдельном листе, который был нами назван «Итоги». Как видим, данные представлены сумбурно, поэтому их следует отредактировать, расширив соответствующие колонки для более удобного просмотра.

  • После того, как данные «причесаны» можно приступать к их непосредственному анализу. Как видим, при помощи инструмента описательной статистики были рассчитаны следующие показатели:
    • Асимметричность;
    • Интервал;
    • Минимум;
    • Стандартное отклонение;
    • Дисперсия выборки;
    • Максимум;
    • Сумма;
    • Эксцесс;
    • Среднее;
    • Стандартная ошибка;
    • Медиана;
    • Мода;
    • Счет.
  • Если какие-то из вышеуказанных данных для конкретного вида анализа не нужны, то их можно удалить, чтобы они не мешали. Далее производится анализ с учетом статистических закономерностей.

    Как видим, с помощью инструмента «Описательная статистика» можно сразу получить результат по целому ряду критериев, которые в ином случае рассчитывались с применением отдельно предназначенной для каждого расчета функцией, что заняло бы значительное время у пользователя. А так, все эти расчеты можно получить практически в один клик, использовав соответствующий инструмент — Пакета анализа.

    Отблагодарите автора, поделитесь статьей в социальных сетях.

    Статистический анализ в Excel.

    Создаем новый лист. Переименовываем лист в «Описательная статистика». Копируем значения максимальных значений сопротивлений (в моем случае это R5). Справа вводим формулу для нахождения Р: 1/$(ссылка на Счет). Находим число сопротивлений: в ячейку Счет вводим формулу СЧЕТ(ссылка на все сопротивления). Далее задаем arg (x), который меняется от значения хmin-1 до хmax+1с шагом 0,01. Для этого в первую строку вводим функцию хmin-1; во вторую длеаем ссылку на первую и прибавляем шаг. Далее протягиваем эти значения до значения хmax+1. Далее вводим сумму всех вероятностей, для которых х меньше чем значение arg(x). Для этого в ячейку F*(x) вводим формулу: функция СУММЕСЛИ( $«ссылки на все сопротивления»; ”


    Рисунок 1 — Описательная статистика.

    Получим статистический отчет по сопротивлениям в виде таблицы. В полученном отчете появятся следующие параметры:

    «Среднее» — это оценка математического ожидания (рассчитывает среднюю арифметическую значений, заданных в списке аргументов).

    «Стандартная ошибка» — определение средней ошибки выборки. Средняя ошибка выборки характеризует стандартное отклонение вариантов выборочной средней от генеральной средней и зависит от колеблемости признака в генеральной совокупности, числа отобранных единиц, а также от способа организации выборки.

    «Медиана» — отображает значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.

    «Мода» — отображает наиболее часто встречающееся значение в интервале данных.

    «Стандартное отклонение» — это корень из дисперсии;

    «Дисперсия выборки» — числовая характеристика случайной величины, характеризующая рассеяние ее возможных значений около математического ожидания.

    «Эксцесс» — характеризует так называемую «крутость», т. е. островершинностьили плосковершинность распределения.

    «Асимметричность» — показывает распределение случайной величины относительно математического ожидания.

    «Интервал» — показывает длинну интервала, в которую укладываются случайные величины (разность между максимальным и минимальным случайными величинами).

    «Минимум» — находит наименьшее значение в множестве данных.

    «Максимум» — находит наибольшее значение в множестве данных.

    «Сумма» — находит сумму всех аргументов.

    «Счет» — рассчитывает количество чисел в списке аргументов.

    «Наибольший» — находит k-й по порядку наибольшее значение в множестве данных.

    «Наименьший» — находит k-е по порядкунаименьшее значение в множестве данных.

    «Уровень надежности» — определение коэффициента Стьюдента по заданному уровню надежности. Коэффициент Стьюдента определяет возможные пределы ошибки.

    Найдем также нормальные функции распределения.

    Для нахождения теоретической функциираспределения (нормальной функциейраспределения называют функцию F(x), определяющую для каждого значенияxслучайной величиныXвероятность того, что величина X примет значение, меньшее x, то есть F(x) = P(X

    Ссылка на основную публикацию
    Adblock
    detector