${message}

${message}

Курс представляет собой полноценное обучение инструментам вычислительной статистики в среде MATLAB на базе практических примеров.

Рассматриваемые темы:

  • Обработка данных;

  • Описательная статистика;

  • Визуализация данных;

  • Подбор распределений;

  • Выполнение гипотезы тестов;

  • Дисперсионный анализ;

  • Подбор регрессионных моделей;

  • Уменьшение размерности данных;

  • Генерация случайных чисел и выполнения симуляций.

Предварительная подготовка:

Практические знания MATLAB (MLBE) и базовой статистики.

Продолжительность - 2 дня.

Подробная программа курса:

Модуль 1. Импорт и организация данных.

Понимание методов импорта для различных типов данных, доступных в MATLAB и Statistics Toolbox, для дальнейшей организации и анализа. Выполнение общих задач, таких как объединение данных и работа с недостающими данными.

  • Импорт данных;
  • Типы данных;
  • Тип данных Dataset
  • Объединение данных;
  • Категории данных;
  • Несоразмерные и отсутствующие данные.

Модуль 2. Исследование данных.

В данном модуле рассматриваются основные статистические исследования данных, включая визуализацию и расчет сводных статистических данных.

  • Статистическая визуализация;
  • Среднее значение;
  • Разброс;
  • Форма;
  • Корреляция;
  • Группированные данные.

Модуль 3. Параметрические и непараметрические распределения.

В этом модуле освещаются функциональности, доступные в Statistics Toolbox, для исследования различных распределений вероятности и подбора их параметров.

  • Распределения вероятностей;
  • Параметры распределения;
  • Сравнение и подбор распределений;
  • Непараметрические распределения;
  • Задание распределения в виде объекта.

Модуль 4. Гипотезы тесты.

Использование Statistics Toolbox, для определения вероятности принадлежности классу распределений. Применить тест гипотезу для общего использования, таких как сравнение двух распределений и определения доверительных интервалов для выборок.

  • Проверка гипотезы;
  • Тест на принадлежность нормальному распределению;
  • Тест на проверку произвольного распределения.

Модуль 5. Дисперсионный анализ.

В этом модуле рассматриваются задачи сравнения выборочных средних нескольких групп и нахождение статистически значимых различий между группами.

  • Множественные сравнения;
  • Одномерный ANOVA анализ;
  • N-мерный ANOVA анализ
  • Многомерный ANOVA анализ;
  • ANOVA анализ для произвольного распределения;
  • Категориальная корреляция.

Модуль 6. Регрессионный анализ.

Выполнение предсказательного моделирования на основе подбора линейной и нелинейной модели. Исследование техник для повышения качества модели.

  • Модели линейной регрессии;
  • Подбор линейной модели по исходному множеству данных;
  • Оценка модели;
  • Настройка модели;
  • Графики разбросов;
  • Логистическая и обобщенные линейные модели;
  • Нелинейные модели.

Модуль 7. Обработка данных высокой размерности.

Знакомство с методами снижения размерности набора данных, а также выполнение классификации для случая категориальной переменной.

  • Преобразования компонент;
  • Выбор характеристик;
  • Классификация;
  • Кластеризация.

Модуль 8. Генерация случайных чисел.

Использование случайных чисел для оценки неопределенности или чувствительности модели, или выполнения симуляций. Генерация случайных чисел из различных распределений и управление алгоритмами генерации случайных чисел.

  • Бутстреп и симуляция;
  • Генерация случайных чисел из нормального распределения;
  • Генерация случайных чисел из произвольного распределения;
  • Управление потоком случайных чисел.

Задать вопрос