Курсы Другие курсы

BigData

Аналитика больших данных для руководителей


Продолжительность: 24 ч    

Описание курса

Этот трехдневный курс предоставляет необходимые знания для участия в проектах по анализу больших данных. Включает информацию о фазах жизненного цикла процессов аналитики больших данных при переходе бизнеса к использованию Big Data.
Материал курса обеспечивает слушателей знанием базовых и расширенных аналитических методов и техник, применяемых для поиска и извлечения знаний из больших массивов разнородных данных. Сравнение различных версий дистрибутивов платформы Hadoop, облачные сервисы для хранения и аналитики данных, "open source" и коммерческие инструменты используемые для хранения, обработки, визуализации и аналитики больших данных.

В программе курса подробно рассматриваются сценарии применения технологий работы с Большими Данными (Big Data) в различных отраслях бизнеса (Банки и финансовые учреждения, промышленность, торговля и транспорт) и организациях государственного сектора, начиная от процесса инициации проекта по цифровизации предприятия (сбора больших данных, формирования команды проекта по аналитики больших данных) и включая все фазы жизненного цикла работы с большими данными (подготовка данных, выбор модели, пилотное развертывание и тестирование модели, промышленная эксплуатация).

В курсе особое внимание уделяется вопросам работы с персональными данными, монетизации больших данных, обеспечение безопасности при работе с большими данными и возможные сложности и специфика при работе с большими данными для различных секторов экономики.

После курса Вы будете:
-----------------------------------------------
* разбираться в основных понятиях мира Больших Данных, Машинного обучения и Интернета Вещей;
* знать в чем отличие разных версий дистрибутивов Hadoop, Spark, NoSQL или Kafka;
* понимать назначение компонентов экосистемы Hadoop, Spark, Kafka;
* видеть нюансы облачных решений;
* знать что такое стандарт GDPR;
* понимать особенности Индустриального интернета Вещей;

Аудитория:
----------------
Курс ориентирован на руководителей, менеджеров и специалистов, желающих получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах больших данных.

Предварительный уровень подготовки: предварительный опыт не требуется.

Программа курса

1. Введение в Big Data (Большие данные)

Большие данные и цифровая трансформация
Методы аналитики больших данных
Отраслевая специфика аналитики больших данных
Сценарии применения аналитики больших данных
Жизненный цикл аналитики данных: Получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение
Формирование озера данных Data Lake

2. Data Mining — извлечение знаний из больших данных

Задачи и техники Data Mining
Классификация и кластеризация
Прогнозирование и визуализация
Ассоциативные правила и обнаружение аномалий
Методология CRISP-DM
Инструменты Data Mining
Специфика применения Data Mining для разных отраслей бизнеса с примерами

3. Машинное обучение для Data mining

Основные определения
Задачи и область применения машинного обучения
Supervised/unsupervised машинное обучение
Инструменты и технологии машинного обучения

4. Data mining в социальных сетях

Введение в анализ социальных сетей и теорию графов
Базовые алгоритмы на графах и основные возможности графового анализа
Феномен маленького мира
Выделение важных узлов в социальных сетях
Инструменты и методы визуализации графов для применения в бизнесе

5. Инструментарий для работы с Big Data

Специфика работы с Big Data
Аналитика для неструктурированных данных с использованием Hadoop
Назначение и характеристика компонент экосистемы Apache Hadoop для хранения и обработки Big Data (MapReduce, HDFS, YARN, Spark, HBase, Hive, и т.д.)
Сравнительный анализ Hadoop дистрибутивов (Cloudera, Horton Works, MapR) и инструментария аналитика данных на примерах использования
Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data
Облачные платформы (AWS, EMR, Azure) для реализации решений по Big Data
Средства визуализации для аналитики данных.

6. Интеграция Больших данных

Основные принципы работы с Big Data
Импорт и экспорт данных с Hadoop (SQL, NoSQL, HDFS, NFS, потоковые данные, web content, файлы логов, социальные сети)
Пакетная и динамическая загрузка данных

7. Правовые аспекты организации защиты персональных данных

Правовое регулирование в области защиты персональных данных
Международная практика в области защиты персональных данных
Права субъекта и обязанности оператора при обработке персональных данных
Виды нарушений безопасности персональных данных
Стандарт GDRP

8. С чего начать?

Формирование команды проекта Big Data. Ключевые роли
Специфика рынка данных и аналитики
Использование подходов Agile и DevOps
Методологии для Стандарты
Отличия подходов Business Intelligence и Data Science
Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data.