${message}

${message}

Анализ и моделирование данных с использованием статистики и машинного обучения.

Statistics and Machine Learning Toolbox предоставляет функции и приложения для описания, анализа и моделирования данных. Вы можете использовать описательную статистику и графики для исследовательского анализа данных, подгонять распределения вероятностей к данным, генерировать случайные числа для моделирования Монте-Карло и выполнять тесты гипотез. Алгоритмы регрессии и классификации позволяют делать выводы из данных и строить прогнозные модели.

Для многомерного анализа данных набор инструментов Statistics and Machine Learning Toolbox предоставляет выбор объектов, пошаговую регрессию, анализ основных компонентов (PCA), регуляризацию и другие методы уменьшения размерности, которые позволяют идентифицировать переменные или объекты, влияющие на вашу модель.

Инструментарий предоставляет методы машинного обучения с учителем и без учителя, включая метод опорных векторов (SVM), бустинг и бутсреп агрегация деревьев решений, k ближайших соседей, k-средних и k-medoids, иерархическая кластеризация, модели Гауссовой смеси, и скрытых марковских моделей. Многие статистические данные и алгоритмы машинного обучения могут использоваться для вычислений в наборах данных, которые слишком велики для хранения в памяти.

Исследовательский анализ данных

Исследуйте данные с помощью интерактивной графики и описательной статистики. Определение шаблонов и объектов с помощью кластеризации.

Визуализация

Визуально исследуйте данные с помощью вероятностных графиков, диаграмм размаха, гистограмм, квантиль-квантильных графиков и расширенных графиков для многомерного анализа, таких как дендрограммы, биплоты и графики Эндрюса.


Многомерная точечная диаграмма для изучения связей между переменными


Описательная статистика

Быстрое понимание и описание потенциально больших наборов данных, используя несколько очень важных чисел.


Исследование данных с помощью сгруппированных средних и отклонений от средних


Кластерный анализ

Обнаружение шаблонов путем группировки данных с использованием k-средних, K-медоидов, DBSCAN, иерархической кластеризации, гауссовой смеси и скрытых марковских моделей.


Применение DBSCAN к двум концентрическим группам

Извлечение признаков и уменьшение размерности

Преобразование необработанных данных в характеристики, наиболее подходящие для машинного обучения. Итеративно исследуйте и создавайте новые характеристики, а также выбирайте те, которые оптимизируют производительность.

Извлечение характеристик

Извлечение характеристик из данных с использованием методов обучения без учителя, таких как разреженная фильтрация и восстановление ICA. Вы также можете использовать специальные методы для извлечения объектов из изображений, сигналов, текста и числовых данных.


Извлечение характеристик из сигналов, захваченных из мобильных устройств


Выбор компонент

Автоматическое определение подмножеств объектов, которые обеспечивают наилучшую прогностическую способность при моделировании данных. Методы выбора компонентов включают пошаговую регрессию, последовательный выбор компонент, регуляризацию и методы ансамблей.


NCA помогает выбрать характеристики, которые наиболее точно описывают модель


Преобразование характеристик и уменьшение размерности

Уменьшение размерность путем преобразования существующих (некатегориальных) характеристик в новые переменные предиктора, где можно отбросить менее описательные характеристики. Методы преобразования признаков включают PCA, факторный анализ и неотрицательную матричную факторизацию.


NCA помогает выбрать характеристики, которые наиболее точно описывают модельPCA проецирует множество переменных на несколько ортогональных осей, которые сохраняют большую часть информации

Машинное обучение

Построение прогнозных классификационных и регрессионных моделей с помощью интерактивных приложений. Автоматический выбор характеристик и настройка моделей путем оптимизации гиперпараметров.

Обучение, проверка и настройка прогнозных моделей

Сравните различные алгоритмы машинного обучения, выберите характеристики, отрегулируйте гиперпараметры и оцените качество предсказания.


Классификация данных с использованием Classification Learner App


Классификация

Смоделируйте категориальную переменную ответа как функцию одного или нескольких предикторов. Используйте различные параметрические и непараметрические алгоритмы классификации, включая логистическую регрессию, SVM, бустинг и бутстреп агрегацию на основе деревьев решений, наивные Байес, дискриминантный анализ и k-ближайших соседей.


Обучение классификаторы в интерактивном режиме с помощью приложения Classification Learner

Задать вопрос