${message}

Этот курс представляет собой введение в статистические инструменты MATLAB и Statistics and Machine Learning Toolbox. Даются конкретные примеры и методы работы со статистикой.

  • Обработка данных.
  • Описательная статистика.
  • Визуализация данных.
  • Подбор распределений
  • Выполнение гипотезы тестов
  • Дисперсионный анализ
  • Подбор регрессионных моделей
  • Уменьшение размерности данных
  • Генерация случайных чисел и выполнения симуляций.

Предварительная подготовка:

Практические знания MATLAB и базовой статистики.

Продолжительность 2 дня.


Программа курса:

Модуль 1. Импорт и организация данных.

Модуль 2. Исследование данных.

Модуль 3. Параметрические и непараметрические распределения.

Модуль 4. Гипотезы тесты.

Модуль 5. Дисперсионный анализ.

Модуль 6. Регрессионный анализ.

Модуль 7. Обработка данных высокой размерности.

Модуль 8. Генерация случайных чисел.

Программа курса

Модуль 1.  Импорт и организация данных.

Понимание методов импорта для различных типов данных, доступных в MATLAB и Statistics Toolbox, для дальнейшей организации и анализа. Выполнение общих задач, таких как объединение данных и работа с недостающими данными.

  • Импорт данных.
  • Типы данных.
  • Тип данных Dataset
  • Объединение данных.
  • Категории данных.
  • Несоразмерные и отсутствующие данные.

Модуль 2. Исследование данных.

В данном модуле рассматриваются основные статистические исследования данных, включая визуализацию и расчет сводных статистических данных.

  • Статистическая визуализация.
  • Среднее значение.
  • Разброс.
  • Форма.
  • Корреляция.
  • Группированные данные.

Модуль 3. Параметрические и непараметрические распределения.

В этом модуле освещаются функциональности, доступные в Statistics Toolbox, для исследования различных распределений вероятности и подбора их параметров.

  • Распределения вероятностей.
  • Параметры распределения.
  • Сравнение и подбор распределений.
  • Непараметрические распределения.
  • Задание распределения в виде объекта.

Модуль 4. Гипотезы тесты.

Использование Statistics Toolbox, для определения вероятности принадлежности классу распределений. Применить тест гипотезу для общего использования, таких как сравнение двух распределений и определения доверительных интервалов для выборок.

  • Проверка гипотезы.
  • Тест на принадлежность нормальному распределению.
  • Тест на проверку произвольного распределения.

Модуль 5. Дисперсионный анализ.

В этом модуле рассматриваются задачи сравнения выборочных средних нескольких групп и нахождение статистически значимых различий между группами.

  • Множественные сравнения.
  • Одномерный ANOVA анализ.
  • N-мерный ANOVA анализ
  • Многомерный ANOVA анализ.
  • ANOVA анализ для произвольного распределения.
  • Категориальная корреляция

Модуль 6. Регрессионный анализ.

Выполнение предсказательного моделирования на основе подбора линейной и нелинейной модели. Исследование техник для повышения качества модели.

  • Модели линейной регрессии.
  • Подбор линейной модели по исходному множеству данных.
  • Оценка модели.
  • Настройка модели.
  • Графики разбросов.
  • Логистическая и обобщенные линейные модели.
  • Нелинейные модели.

Модуль 7. Обработка данных высокой размерности.

Знакомство с методами снижения размерности набора данных, а также выполнение классификации для случая категориальной переменной.

  • Преобразования компонент.
  • Выбор характеристик.
  • Классификация.
  • Кластеризация.

Модуль 8. Генерация случайных чисел.

Использование случайных чисел для оценки неопределенности или чувствительности модели, или выполнения симуляций. Генерация случайных чисел из различных распределений и управление алгоритмами генерации случайных чисел.

  • Бутстреп и симуляция.
  • Генерация случайных чисел из нормального распределения.
  • Генерация случайных чисел из произвольного распределения.
  • Управление потоком случайных чисел.
Поделиться
*
Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006, отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных . Мы, ООО ЦИТМ "Экспонента" и аффилированные к нему лица, гарантируем конфиденциальность получаемой нами информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и пр. в соответствии с «Политикой конфиденциальности персональных данных». * - обязательные поля