StatSoft
StatSoft

 

Развернутый курс по Data Mining (добыче данных)

В течение тренинга пользователь интенсивно и всесторонне освоит идеологию и инструментарий Data mining – Добычи данных, реализованные в STATISTICA Data Miner, и научится решать конкретные задачи добычи данных. Результатом прослушивания курса является свободное овладение пакетом STATISTICA Data Miner – STATISTICA Добытчик данных, возможность самостоятельной работы и эффективного решения прикладных задач в STATISTICA DM.
Требования к участникам: курс рассчитан на пользователей знакомых с работой в системе STATISTICA 6.

Что такое Data Mining – Добыча данных: парадигма Data Mining

  • ключевые понятия и определения

  • первое знакомство с системой STATISTICA Data Miner (обзор, уникальные возможности, построение системы) STATISTICA Data Miner

Уникальные возможности STATISTICA DM

  • ключевые понятия и определения

  • объекты анализов и узлы анализов STATISTICA
  • создание проекта Добычи данных

Обзор используемых инструментов и технических возможностей (часть 1)

  • построение выборки (простая, случайная, генеральная совокупность)
  • контроль потока данных при помощи узлов: принятые соглашение и специализированные опции
  • обработка текстовых переменных и текстовых значений

Обзор используемых инструментов и технических возможностей (часть 2)

  • ключевые понятия и определения

  • настройка параметров отдельного взятого анализа или узла
  • настройка глобальных параметров (всего проекта Добычи данных)
  • добыча данных для очень больших объемов данных (Базы данных): масштабируемость STATISTICA DM

Специализированный инструментарий Data Mining - Добычи данных

  • ключевые понятия и определения

  • специализированный инструментарий Добычи данных (отсеивание признаков, обобщенные методы кластерного анализа, общие деревья классификации и регрессии, общие CHAID модели, интерактивные деревья классификации и регрессии, растущие деревья классификации и регрессии, многомерные адаптивные сплайны, нейронные сети, правила связи, интерактивное бурение и расслоение)

Развертывание моделей

  • ключевые понятия и определения

  • развертывание решений
  • быстрое построение прогноза
  • лифтовые карты выбора оптимальной модели
  • развертывание решений (моделей) для новых данных

Поиск оптимальных моделей; реализация STATISTICA Data Miner моделей при помощи языка STATISTICA Visual Basic

  • ключевые понятия и определения

  • примеры разработанных проектов Добычи данных (углубленные методы классификации, обобщенное прогнозирование)

Продолжительность курса: 12 академических часов.

Заявку на этот курс можно оформить, позвонив в наш офис или заполнив регистрационную карточку через Интернет.

наверх