В
течение тренинга пользователь интенсивно и всесторонне освоит идеологию
и инструментарий Data mining – Добычи данных, реализованные в STATISTICA
Data Miner, и научится решать конкретные задачи добычи данных.
Результатом прослушивания курса является свободное овладение пакетом
STATISTICA Data Miner – STATISTICA Добытчик данных, возможность
самостоятельной работы и эффективного решения прикладных задач в STATISTICA
DM.
Требования к участникам: курс рассчитан на пользователей знакомых
с работой в системе STATISTICA 6.
Что такое
Data Mining – Добыча данных: парадигма Data Mining
- ключевые понятия и определения
- первое знакомство с системой STATISTICA Data Miner (обзор,
уникальные возможности, построение системы)
Уникальные
возможности STATISTICA DM
- ключевые понятия
и определения
- объекты анализов
и узлы анализов STATISTICA
-
создание
проекта Добычи данных
Обзор
используемых инструментов и технических возможностей (часть 1)
- построение
выборки (простая, случайная, генеральная совокупность)
- контроль потока
данных при помощи узлов: принятые соглашение и специализированные
опции
- обработка текстовых
переменных и текстовых значений
Обзор
используемых инструментов и технических возможностей (часть 2)
- ключевые понятия
и определения
- настройка параметров
отдельного взятого анализа или узла
- настройка глобальных
параметров (всего проекта Добычи данных)
- добыча данных
для очень больших объемов данных (Базы данных): масштабируемость
STATISTICA DM
Специализированный
инструментарий Data Mining - Добычи данных
- ключевые понятия
и определения
- специализированный
инструментарий Добычи данных (отсеивание признаков, обобщенные методы
кластерного анализа, общие деревья классификации и регрессии, общие
CHAID модели, интерактивные деревья классификации и регрессии, растущие
деревья классификации и регрессии, многомерные адаптивные сплайны,
нейронные сети, правила связи, интерактивное бурение и расслоение)
Развертывание
моделей
- ключевые понятия
и определения
- развертывание
решений
- быстрое построение
прогноза
- лифтовые карты
выбора оптимальной модели
- развертывание
решений (моделей) для новых данных
Поиск
оптимальных моделей; реализация STATISTICA Data Miner моделей
при помощи языка STATISTICA Visual Basic
- ключевые понятия
и определения
- примеры разработанных
проектов Добычи данных (углубленные методы классификации, обобщенное
прогнозирование)
Продолжительность
курса: 12 академических часов.
Заявку на этот курс можно оформить, позвонив
в наш
офис или заполнив регистрационную
карточку через Интернет.
|