УЦ Микротест - источник ваших знаний
 
Личный кабинет Вход / Регистрация
 
 
 
  Вход Регистрация
Логин*
E-mail, указанный при регистрации
Пароль* не помню
 
Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
 
 
0 позиций

       +7 (495) 231 23 51 Москва

       +7 (964) 778 99 27 Москва

       Дербеневская наб. д.7 стр. 5

Курс Python для анализа данных (Код: S_Python)

SkillFactory

 


Курс длится 128 академических часов


Подробная программа курса

Содержание

Модуль 1 Изучаем Python для задач аналитики

— Тип задач аналитика, решаемых с Python

— Устанавливаем Python: Anaconda и Jupyter notebook

— Инструменты Python для выгрузки и обработки данных

— Основной синтаксис и типы данных

— Работаем с переменными разных типов

— Создаем код, который выполняется в зависимости от выполнения условий

— Работаем с циклами, то есть пишем код, который может многократно повторять одни и те же действия, но с разными данными

Модуль 2 Работаем с большими файлами и сложными метриками

— Считаем сложные метрики в больших файлах в формате txt, xls, xlsx

— Создаем и обрабатываем словари (структуры данных, знание которых пригодится не только в этом модуле, но и в разделах, посвященных работе с web-данными)

— Делаем код гибким и оптимизируем с помощью собственноручно написанных функций

Модуль 3 Введение в Pandas

— Ваш первый аналитический кейс с Pandas

— Работаем с файлами, содержащими миллионы строк с данными (в Excel такой файл даже не откроется!)

— Извлекаем из таблиц данные, соответствующие заданному условию или комплексу условий

— Учимся фильтровать и сортировать данные, вычислять основные статистические показатели, анализировать частотность

Модуль 4 Преобразование таблиц

— Создаем новые столбцы в уже существующем датафрейме

— Учимся группировать данные по столбцам средствами Pandas

— Применяем стандартные и собственные функции к каждой строке датафрейма

— Группируем данные и создаваем таблицы, содержащие только обобщенную информацию из исходного датасета

Модуль 5 Сводные таблицы и аналитика

— Знакомимся с pivot-таблицами и сложной агрегацией средствами Pandas

— Учимся работать со сводными таблицами с несколькими измерениями

— Анализируем предпочтения пользователей киносайта

— Работаем с показателями времени в формате Unixtime

Модуль 6 Объединение датафреймов

— Объединяем два датафрейма в один на основе содержащейся в них общей информации

— Узнаем подводные камни объединения таблиц и научимся их обходить

— Находим и удаляем из датафрейма строки-дубликаты

— Используем значение not-a-number для отсутствующих количественных данных

— Обогащаем служебную выгрузку новыми данными и составляем рейтинг киноновинок

Модуль 7 Работа с множеством файлов средствами Pandas

— Учимся получать список имен файлов, хранящихся в заданной папке

— Учимся работать с множеством однотипных файлов с помощью циклов

— Генерируем путь доступа к файлу, включающий последовательность вложенных папок

— Добавляем в существующий датафрейм информацию, полученную из нескольких csv-файлов

Модуль 8 Работа со временем и датами

— Преобразовываем строку, содержащую информацию о дате и (или) времени, в переменную типа datetime

— Извлекаем из переменной типа datetime информацию о количестве дней, часов, минут, секунд в конкретной дате

— Учимся складывать и вычитать даты

Модуль 9 Визуализация и отчеты. От Pandas до Plotly

— Научимся использовать встроенные в Pandas графические функции для создания простейших графиков

— Строим гистограммы, линейные графики, heatmap и настраиваем параметры их отображения с помощью библиотек Matplotlib и Seaborne

— Работаем с библиотекой Plotly для создания интерактивных отчетов

Модуль 10 Словари. Рекурсия

— Устанавливаем значения словаря по умолчанию

— Объединяем в одном датафрейме данные из нескольких текстовых файлов

— Используем рекурсию как альтернативу большому числу вложенных циклов

Модуль 11 Работа с веб-страницами

— Извлекаем данные из веб-стриниц, не открывая эти страницы в браузере

— Загрузка HTML-страниц в датафрейм

— Учимся работать с API VK и получаем данные из общедоступных профилей пользователей социальной сети Вконтакте

— Систематизируем информацию о работе сообществ VK и выгружаем статистику из группы (список пользователей, их активность, публикации на стене сообщества и т.д.)

Модуль 12 Изучаем API сервисы Яндекса

— Проходим авторизацию в Яндекс.Метрике

— Настраиваем автоматический мониторинг показателей сайта по данным Яндекс.Метрики

— Создаем запросы, содержащие различные комбинации метрик, группировок и фильтров

— Выгружаем отчеты Яндекс.Метрики любого размера

— Узнаем, как сделать универсальный отчет с любыми совместимыми метриками

— Преобразовываем результаты выгрузки данных, полученных по запросу к Яндекс.Метрике, в Pandas.Dataframe

Модуль 13 Изучаем API сервисы Google

— Проходим авторизацию и создаем проекты в Google Developers Console

— Создаем запросы к Google Analytics, используя различные комбинации метрик, группировок и фильтров

— Организуем постраничную выгрузку больших отчетов Google Analytics

— Автоматическое обновление токенов для регулярных автоматических выгрузок

Модуль 14 Строим отчетность с помощью Google Sheets

— Подключаем Google Sheets API и проходим авторизацию для работы с таблицами с помощью API

— Работаем с UTM-метками

— Строим автоматические красивые отчеты в Google Sheets и делимся ими с коллегами

Модуль 15 Работаем с ошибками и техническими проблемами. Создаем бота в Telegram

— Узнаем, как предусмотреть наличие кривых данных, недоступность сервиса и другие неприятности

— Создаем код, который не прерывает свое выполнение даже при возникновении ошибки

— Настраиваем автоматический запуск скрипта с помощью Планировщика задач Windows

— Создаем Телеграм-бота, умеющего рассылать файлы и сообщения

Модуль 16 Делаем семантический анализ текстов

— Определяем основу слова и проводим морфологический разбор слов с помощью библиотек для обработки естественного языка (Natural Language Processing)

— Поиск опечаток и близких по значению слов

— Работаем с регулярными выражениями

— Создаем скрипт, определяющий эмоциональную (положительную или отрицательную) окраску текста

Модуль 17 Экзамен

— Финальный экзамен, получение диплома

Скрыть подробную программу курса

Заказать обучение «Python для анализа данных (S_Python)» можно, кликнув на удобную дату его проведения, по почте training AT training-microtest DOT ru или по одному из телефонов, указанных в разделе Контакты.



 
Заказать
Добавить отзыв Вы сможете после регистрации на нашем сайте

Зарегистрироваться или авторизоваться