итмо лаборатория машинного обучения

«Национальный исследовательский университет ИТМО»

Формы вступительных испытаний:

Описание программы

Магистерская программа «Большие данные и машинное обучение» Университета ИТМО готовит специалистов в области прикладной математики и информатики, компетентных в проектировании, разработке и использовании технологии Big Data и машинного обучения для решения различных задач. В ходе обучения магистранты получат необходимые знания и навыки, в том числе для применения и разработки методов интеллектуального анализа данных, решения прикладных задач по обработке больших объемов информации и визуализации больших данных.

Программа рассчитана на студентов, которые стремятся не только получить знания теоретических и практических основ профильных дисциплин, но и погрузиться в реальную проектную работу с исследовательским фокусом. Исследовательская работа ведется как над академическими задачами, нацеленными на результаты мирового уровня с презентациями на международных конференциях, так и над промышленными задачами R&D департаментов ведущих мировых и российских компаний.

Цель программы

Цель образовательной программы: подготовка высококвалифицированных кадров, способных проектировать, разрабатывать и эффективно использовать технологии Big Data и машинного обучения при решении современных задач.

Направление включает в себя:

Обучение на программе подразумевает выбор одной из следующих специализаций:

Основные дисциплины:

Примеры тем выпускных работ:

Источник

Новая библиотека для уменьшения размерности данных ITMO_FS — зачем она нужна и как устроена

Студенты и сотрудники лаборатории Машинного обучения Университета ИТМО разработали библиотеку для Python, которая решает ключевую задачу машинного обучения.

Расскажем, почему появился этот инструмент и что он умеет.

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Нехватка алгоритмов

Одна из ключевых задач машинного обучения — снижение размерности данных. Дата-саентисты сокращают число переменных, вычленяя среди них значения, наибольшим образом влияющие на результат. После этой операции модель машинного обучения требует меньше памяти, работает быстрее и качественнее. Пример ниже показывает, что исключение дублирующих признаков увеличивает точность классификации с 0,903 до 0,943.

Существует два подхода к уменьшению размерности — конструирование и выбор признаков. В областях вроде биоинформатики и медицины чаще используют последний, так как он позволяет выделить значимые признаки с сохранением семантики, то есть не меняет исходный смысл признаков. Однако в самых распространенных библиотеках машинного обучения на Python — scikit-learn, pytorch, keras, tensorflow — нет полноценного набора методов выбора признаков.

Для решения этой проблемы студенты и аспиранты Университета ИТМО разработали открытую библиотеку — ITMO_FS. Над ней трудится команда под руководством Ивана Сметанникова, доцента факультета информационных технологий и программирования, заместителя заведующего лабораторией Машинного обучения. Ведущий разработчик — Никита Пильненьский, закончивший магистратуру «Машинное обучение и анализ данных». Теперь он поступает в аспирантуру.

«За последние несколько лет в нашу лабораторию приходили запросы на решение задач, для которых не подходил стандартный инструментарий. Например, нам требовались ансамблирующие алгоритмы на основе объединения фильтров, или алгоритмы, учитывающие наличие заранее известных (экспертно-размеченных) значимых признаков.

Посмотрев на существующие решения, мы пришли к выводу, что они не только не содержат необходимые нам инструменты, но и не являются достаточно гибкими для их возможной мягкой интеграции. В контексте того, что среди таких библиотек конкуренция слаба, мы решили сделать свою библиотеку, исправляющую большинство недостатков».

Что умеет библиотека

ITMO_FS реализована на Python и совместима со scikit-learn, которая де-факто считается основным инструментом анализа данных. Ее селекторы признаков принимают те же параметры:

Библиотека поддерживает все классические подходы к отбору признаков — фильтры, обертки и встраиваемые методы. Среди них числятся такие алгоритмы, как фильтры на основе корреляций Спирмена и Пирсона, критерий соответствия (Fit Criterion), QPFS, hill climbing filter и другие.

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Также библиотека поддерживает обучение ансамблей за счет объединения алгоритмов выбора признаков по используемым в них мерам значимости. Такой подход позволяет получать более высокие прогностические результаты при низких временных затратах.

Какие есть аналоги

Библиотек алгоритмов выбора признаков существует не так много — особенно на Python. Одной из крупных считают разработку инженеров из Государственного университета Аризоны (ASU). Она поддерживает большое количество алгоритмов, но последнее время почти не обновляется.

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

В самой scikit-learn также есть несколько механизмов выбора признаков, но на практике их оказывается недостаточно.

«Вообще за последние пять–семь лет фокус сильно сместился в сторону ансамблирующих алгоритмов выбора признаков, но они особо не представлены в подобных библиотеках, что мы также хотим исправить».

Перспективы проекта

Авторы ITMO_FS планируют интегрировать свой продукт с scikit-learn, добавив его в список официально совместимых библиотек. На данный момент библиотека уже содержит наибольшее среди всех библиотек число алгоритмов выбора признаков, но их добавление продолжается. Дальше на дорожной карте добавление новых алгоритмов, включая собственные разработки.

В более далеких планах стоят задачи внедрить библиотеку в систему мета-обучения, добавить алгоритмы прямой работы с матричными данными (заполнение пропусков, генерация данных мета-признакового пространства и т. д.), а также графический интерфейс. Параллельно с этим будут проходить хакатоны с использованием библиотеки, чтобы заинтересовать в продукте большее число разработчиков и получить фидбек.

Ожидается, что ITMO_FS найдет применение в областях медицины и биоинформатики — в таких задачах, как диагностика различных раковых заболеваний, построение прогностических моделей фенотипических характеристик (например, возраста человека) и синтез лекарственных препаратов.

Где скачать

Если вас заинтересовал проект ITMO_FS, вы можете скачать библиотеку и опробовать её на практике — вот репозиторий на GitHub. Начальная версия документации доступна на readthedocs. Там же можно посмотреть инструкцию по установке (поддерживается pip). Мы будем рады любой обратной связи.

Дополнительные материалы из нашего блога на Хабре:

Источник

Machine Learning Lab | ITMO University

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Добро пожаловать на страницу лаборатории машинного обучения ИТМО!

Здесь вы найдёте новости о наших проектах, событиях и достижениях.

Мы всегда открыты для новых идей и сотрудничества!

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Machine Learning Lab | ITMO University запись закреплена
Университет ИТМО

Главное AI-событие года уже совсем скоро!

10 — 12 ноября пройдет ежегодная серия онлайн-мероприятий в области Machine Learning & Artificial Intelligence AI JOURNEY 2021.

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Machine Learning Lab | ITMO University запись закреплена

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Machine Learning Lab | ITMO University запись закреплена
Университет ИТМО

Подписали первый в России кодекс этики искусственного интеллектаитмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Сегодня, 26 октября, при поддержке Правительства РФ представители федеральных и региональных органов власти, ведущие российские компании и университеты подписали первый в России кодекс этики искусственного интеллекта.

Документ станет частью федерального проекта «Искусственный интеллект» и Стратегии развития информационного общества на 2017–2030 годы. Рассказываем об этом в материале: https://bit.ly/3jCHnSC

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Machine Learning Lab | ITMO University запись закреплена

Научную статью аспиранта 3 года ФИТиПа Павла Катунина опубликовали в журнале «Frontiers in Cell and Developmental biology». Исследование и одноименная статья «An Open-Source Framework for Automated High-Throughput Cell Biology Experiments» посвящена созданию робота, который поможет исследователям в сборе больших массивов данных снимков с микроскопов, а также поспособствует контролируемо искать оптимальные протоколы для дифференцирования нейронов из стволовых клеток.
Показать полностью. Это первый этап большого исследования по оптимизации дифференцирования стволовых клеток и разработки Computer Vision алгоритмов, и самого метода оптимизации.

По словам Павла, систему было сложно сделать достаточно точной для позиционирования робота на клетках размером в 10-30 микрон, и устранения вибрации системы. Исследователи реализовали робастный алгоритм автофокусировки объектива микроскопа на клетках в режиме флуоресцентной съёмки и bright field. Также авторы сделали систему дешевой, для возможности создавать роботов в большом количестве. Сам робот собран из доступных компонентов, в том числе электроники Arduino.

Оpen-source робот предоставляет новые методы в исследовании и сборе больших данных микроскопических биологических снимков. Данный автоматический метод разработан для постановки биологических экспериментов на клетках и контроля за их ростом с помощью алгоритмов компьютерного зрения и машинного обучения. Также этот метод позволяет собрать больше данных для разработки новых алгоритмов компьютерного зрения.

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обученияСсылка на статью: https://www.frontiersin.org/articles/10.3389/fcell.20..

Источник

Летние стажировки от лаборатории “Машинное обучение”

1. Разработка библиотеки автоматического выбора и настройки алгоритмов кластеризации и соответствующих алгоритмов выбора признаков

В лаборатории реализуется проект по разработке системы (репозиторий скоро обновится) автоматического выбора и настройки алгоритмов кластеризации для заранее заданной меры на Apache Spark. В рамках проекта требуется улучшить существующую систему, добавить реализации различных алгоритмов настройки гиперпараметров (Optuna, H2O и другие). Также требуется реализовать поддержку алгоритмов выбора признаков для задач кластеризации и встроить их в существующий pipeline. Помимо этого опционально требуется реализовать эволюционные алгоритмы кластеризации с настройкой мутации (подробности в тексте диссертационной работы по ссылке). В рамках стажировки будет достаточно выполнения одного из требуемых пунктов, описанных выше.

Что следует сделать:

Требования:

Контакты:

Муравьёв Сергей (mursmail@gmail.com)

Ссылки:

2. Разработка задач по анализу данных на Python

Лаборатория готовит новый образовательный курс по анализу данных и основам машинного обучения. Для курса разрабатываются практические задачи на Python в Jupyter-ноутбуках. В данный момент подготовлена только задача по анализу датасета Titanic. Требуется пополнить пул задач.

Что следует сделать:

Контакты:

Муравьёв Сергей (mursmail@gmail.com), Алексей Забашта (zabashta.alexey@gmail.com)

3. Реалистичное вписывание в видеопоток объектов для размещения рекламных баннеров

Ключевые слова: компьютерное зрение, глубокое обучение, генерация изображения

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Описание: Во многих современных сериалах и фильмах (и прочем видео-контенте) встречается прием продакт-плейсмент, то есть неявная реклама, заключающаяся в том, что реквизит, который попадает в кадр, имеет реальный коммерческий аналог. Продакт-плейсмент может проявляться в демонстрации непосредственно самого рекламируемого продукта, его логотипа или рекламного баннера. Здесь мы рассмотрим последний случай, как наиболее общий.

Цель работы: сгенерировать видео, содержащее рекламу заданных брендов.

Что следует сделать:

Требования:

Ссылки:

Контакты:

Ефимова Валерия (valeryefimova@gmail.com, телеграм @evaleria)

4. Фотореалистичный оффлайн перенос стиля

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Ключевые слова: компьютерное зрение, глубокое обучение, нейронные сети, нейронный перенос стиля, сверточные нейронные сети.

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

Цель работы: предложить оффлайн алгоритм фотореалистичного переноса стиля.

Что следует сделать:

Требования:

Ссылки:

Контакты:

Ефимова Валерия (valeryefimova@gmail.com, телеграм @evaleria)

5. Генерация рекламного объявления по заголовку

Ключевые слова: глубокое обучение, анализ естественного языка (NLP), трансформеры, BERT, генерация изображения, нейронные сети

Описание: В современном мире реклама встречается на каждом шагу, особенно ее много в интернете. Маркетплейсы массово создают рекламные предложения, содержащее некоторый текст, фото продукта и фон. Эти объекты надо скомпоновать визуально привлекательно, что требует неимоверных усилий дизайнеров при условии, что таких изображений много тысяч. В работе предлагается выбирать, какой текст следует разместить на изображении, каким шрифтом и цветом написать, где его расположить и на какой подложке.

Что следует сделать:

Требования:

Ссылки:

Контакты:

Ефимова Валерия (valeryefimova@gmail.com, телеграм @evaleria)

6. Генерация описания бизнеса на английском языке

Ключевые слова: глубокое обучение, анализ естественного языка (NLP), нейронные сети, трансформеры, GPT

Описание: В последние годы образовалось множество мелких компаний, всем им нужно рассказать о себе. Руководитель такого мелкого бизнеса может сам написать оригинальный текст, но это требует умственных усилий и затрат по времени. Бизнесы во многом похожи, а готовый текст намного проще подредактировать, чем писать с нуля. Логичное решение: автоматически генерировать описания для бизнеса определенных категорий.

Что требуется сделать:

Требования:

Ссылки:

Контакты:

Ефимова Валерия (valeryefimova@gmail.com, телеграм @evaleria)

7. Наличие человека в тексте на русском языке

Ключевые слова: глубокое обучение, анализ естественного языка (NLP), нейронные сети, трансформеры, BERT, извлечение именованных сущностей (NER)

Требования:

Ссылки:

Контакты:
Ефимова Валерия (valeryefimova@gmail.com, телеграм @evaleria)

8. Improving Energy-based Models with Adversarial Training

Ключевые слова: глубокое обучение, генерация изображений

Большим преимуществом EBM является совмещение способности классификации и моделирования распределения входных данных! Недавно было показано что любой нейронный классификатор может быть интерпретирован как энергетическая модель, и при специальной тренировке способен генерировать изображения на уровне SOTA генеративных моделей[1]. В тоже время было показано что нейронные сети устойчивые к вредоносным атакам(adversarial robust) также способны осуществлять генерацию изображений[2]

Ввиду схожести процесса inference для adversarial robust и energy-based моделей, предлагается произвести обучение ebm модели с помощью adversarial training на ряде бенчмарков. Подобное исследование обладает высокой актуальностью так как открывает новые связи между моделями и парадигмами машинного обучения.

Что требуется сделать:

Требования:

Ссылки:

Контакты:
Асадулаев Арип (aripasadulaev@itmo.ru, телеграм @postmachines)

9. Разработка задач по генерации данных методами GAN

Лаборатория готовит новый образовательный курс по генеративным моделям. Для курса разрабатываются практические задачи по применению GAN моделей в различных задачах. Стандартными задачами для этой области являются: генерация изображений, улучшение качества изображений, перенос стиля, синтез последовательностей.

Все перечисленные задачи успешно решаются с помощью GAN моделей, требуется реализовать фреймворк для быстрого запуска GAN моделей для этих задач(в качестве основы можно использовать фреймворки которые есть в открытом доступе).

Что следует сделать:

Контакты:
Асадулаев Арип (aripasadulaev@itmo.ru, телеграм @postmachines)

10. Прогнозирование поведения клиентов на базе их поведения на маркетплейсе OZON

Ключевые слова: прогнозные системы, кластеризация данных

Описание: На основании данных OZON (события с их сайта и приложения) о поведении пользователей (открытие различных страниц, добавление в корзину, покупка и др.) можно видеть, сколько и какие товары покупает увидевший (post-view конверсия) рекламу или кликнувший (post-click конверсия) по ней.

Задача: Разработать ML модель, учитывающую post-click поведение пользователей на OZON на имеющихся событиях.

Цель работы: Обеспечить ДРР

Для диагностики меланомы используются специальные визуальные признаки структур родинки, называемые дерматоскопическими признаками. Задача сегментации дерматоскопических признаков признана очень сложной, лучший результат метрики IoU на официальных соревнованиях составил 0.473 и был получен с помощью сложных моделей и ансамблирования [1]. После соревнований вышла работа, где авторы заявляют о достижении IoU > 0.7 [2] с помощью замены стандартной функции потерь на дискриминатор из архитектуры Pix2Pix (GAN).

Что требуется сделать:

Требования:

Ссылки:

Контакты:
Полевая Татьяна (tpolevaya@itmo.ru, телеграм @tpolevaya)

12. Self-supervised learning для классификации родинок

Для диагностики меланомы используются специальные визуальные признаки структур родинки, называемые дерматоскопическими признаками. Задача распознавания дерматоскопических признаков признана очень сложной [1]. Тем не менее существует набор неразмеченных данных, которые можно использовать для предобучения сегментации с использованием self-supervised методов. В данной стажировке предлагается применить различные существующие претекст-задачи на неразмеченных данных к задаче распознавания дерматоскопических признаков.

Что требуется сделать:

Требования:

Источник

Большие данные и машинное обучение / Big data and machine learning

ПАСПОРТ ПРОГРАММЫ

Программа магистратуры ориентирована на подготовку специалистов, нацеленных вести инженерно-конструкторские работы для передовой индустрии.

01.04.02 Прикладная математика и информатика

Когнитивные технологии и квантовый интеллект / Cognitive Technologies and Quantum Intelligence

Технологии машинного обучения и анализа больших данных / Machine Learning and Big Data Analysis Technologies

Технологии организации и управления инфраструктурой больших данных / Big Data Infrastructure Organization and Management Technologies

Интеллектуальные технологии больших данных в медицине и здравоохранении / Intelligent Thechnologies of Big Data in Medicine and Healthcare

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

ОПИСАНИЕ ПРОГРАММЫ

Программа готовит специалистов в области прикладной математики и информатики. компетентных в проектировании, разработке и использовании технологии больших данных и машинного обучения для решения различных практических задач.

Вы получите глубокие знания и навыки в:

области работы с технологиями больших данных;

разработке методов интеллектуального анализа данных;

решении прикладных задач по обработке больших объемов информации и визуализации больших объемов данных.

Программа реализуется в сотрудничестве с Национальным центром когнитивных разработок Университета ИТМО. Вы получите не только теоретические знания, но и погрузитесь в реальную научно-исследовательскую и проектную работу с промышленными партнерами. Работа ведется как над академическими задачами, с возможностью последующей презентации результатов на международных конференциях, так и над промышленными задачами R&D департаментов ведущих мировых и российских компаний.

Обучение в магистратуре подразумевает выбор одной из пяти специализаций:

Специализация 1. Технологии организации и управления инфраструктурой больших данных

Специализация направлена на изучение современной инфраструктуры для сбора, хранения и обработки сверхбольших данных.

Вы сможете работать:

инженерами-исследователями, работающими над исследовательскими проектами;

специалистами, работающими с высоконагруженными системами хранения данных.

Специализация 2. Технологии машинного обучения и анализа больших данных

Вы изучите методы, модели и высокоэффективные алгоритмы для автоматического извлечения знаний из данных методами машинного обучения, а также анализ данных с помощью методов глубокого обучения и нейронных сетей.

Специализация ориентирована на следующие профессии:

специалист по анализу данных;

аналитик и разработчик программного обеспечения в крупных исследовательских центрах и инновационных стартапах;

научный сотрудник в академической среде ведущих мировых и российских вузов.

Специализация 3. Когнитивные технологии и квантовый интеллект

Вы познакомитесь с моделированием сложных социально-экономических процессов с применением современных методов квантовой теории информации, когнитивных технологий, машинного обучения и искусственного интеллекта.

разработчиками нового программного обеспечения;

математиками-исследователями (аналитиками) по новым формам экономики и финансов (когнитивная экономика);

разработчиками систем искусственного интеллекта с элементами когнитивных и квантовых вычислений.

Специализация 4. Интеллектуальные технологии больших данных в медицине и здравоохранении

Вы освоите методы формализации, структурирования, интерпретации и усвоения знаний для задач поддержки принятия решений в медицине и здравоохранении. Специализация также включает в себя курсы по математической эпидемиологии и медицинской статистики.

Мы в социальных сетях :

итмо лаборатория машинного обучения. Смотреть фото итмо лаборатория машинного обучения. Смотреть картинку итмо лаборатория машинного обучения. Картинка про итмо лаборатория машинного обучения. Фото итмо лаборатория машинного обучения

АКТУАЛЬНОСТЬ И ЗНАЧИМОСТЬ ПРОГРАММЫ

Грамотный анализ накопленных данных повышает конкурентоспособность любой компании. Рынок нуждается в специалистах, способных правильно выстраивать логику и процесс проводимого анализа, реализовывать высокоэффективные алгоритмы обработки данных в распределенной вычислительной среде. Актуальным требованием становится не только умение применять отдельные методы машинного обучения, но и понимание подходов искусственного интеллекта на системном уровне. Умение проектировать прогностические и имитационные модели для решения трудно формализуемых задач делает выпускников данной программы крайне востребованными специалистами. Это подтверждается успешным сотрудничеством с такими компаниями, как Сименс, Хуавей, РосНефть, ГазпромНефть, МТС, Банк Санкт-Петербург, Mail.Ru, BCC, Расофт.

ЦЕЛЬ ПРОГРАММЫ

Цель образовательной программы: подготовка высококвалифицированных кадров, способных проектировать, разрабатывать и эффективно использовать технологии больших данных и машинного обучения для решения современных задач.

Направление включает в себя:

создание научно-технологической базы современной распределенной вычислительной инфраструктуры для сбора, хранения и обработки сверхбольших данных в логике технологий Big Data;

разработку методов, моделей и высокоэффективных алгоритмов для автоматического извлечения знаний из данных методами машинного обучения и эволюционных вычислений;

развитие методов формализации, структурирования, агрегации, интерпретации и усвоения знаний, извлеченных из сверхбольших массивов данных для задач поддержки принятия решений.

ДИСЦИПЛИНЫ

Анализ и разработка алгоритмов

В данном курсе рассматриваются анализ сложности алгоритмов, принципы их построения, структуры данных, а также специальные алгоритмы, предназначенные, прежде всего, для решения задач машинного обучения. После освоения дисциплины студенты получат навыки анализа сложности алгоритмов, научатся выбирать структуры данных и алгоритмические методы для решения поставленной задачи, а также получат практический опыт разработки и применения алгоритмов оптимизации многомерных функций, а также алгоритмов на графах.

Методология трансляционных исследований

Курс является межфакультетским модулем мегафакультета трансляционных информационных технологий. Курс построен таким образом, чтобы покрыть все разделы цикла трансляционных исследований от анализа предметной области, обоснования гипотез и выбора путей их исследования и заканчивая разработкой методик использования цифрового образа и создания демонстраторов задач и технологий. После освоения дисциплины студенты получат знания о современных методах анализа фактографической информации, системном анализе и информационном моделировании, моделях на данных и их обучении, интеллектуализации процесса цифровых научных исследований и разработок и технологиях использования результатов в предметных областях.

Методы и модели многомерного анализа данных

Курс знакомит студентов с основами многомерного статистического анализа данных и теоретическими основами вероятностного моделирования многомерной случайной величины, а также с методами проведения верификации и валидации моделей. Студенты научатся разрабатывать и реализовывать эффективные алгоритмы многомерного анализа сложных данных, применять методы проверки работоспособности решения, использовать методы оценки результатов моделирования.

Инфраструктура больших данных (КР1)

В данном курсе рассматриваются актуальные задачи, связанные с принципами построения и основами организации разработки современных программных решений для обработки больших данных. Речь пойдет в том числе о распределенных файловых системах HDFS, технологии MapReduce, Apache ZooKeeper, менеджерах ресурсов YARN и Mesos.Материал сопровождается практическими задачами, связанными с обработкой больших данных.

Квантовые когнитивные технологии систем искусственного интеллекта

Технологии машинного обучения (КР2)

В данном курсе рассматриваются классические и современные методы анализа данных на основе алгоритмов машинного обучения. После освоения дисциплины студенты смогут производить подготовку наборов данных для обучения предсказательных моделей, осуществлять подбор параметров алгоритмов машинного обучения для повышения качества получаемых решений, использовать современные алгоритмы машинного обучения, интеллектуального анализа данных и глубокого обучения для решения практических задач.

Эволюционные вычисления

Курс знакомит студентов с основными принципами разработки и реализации эволюционных алгоритмов для различных задач оптимизации, методами повышения производительности алгоритмов и их реализация на основе многопроцессорных и распределенных систем, а также с использованием графических процессоров. В ходе курса студенты получат опыт анализа реальных решаемых задач с использованием эволюционных вычислительных методов и приобретут навыки по настройке и тестированию эволюционных алгоритмов.

Квантовая информатика и теории квантовых алгоритмов

Визуализация данных

Курс представляет собой введение в основные принципы и методы интерактивной визуализации данных. В этом курсе вы узнаете, как человеческая зрительная система обрабатывает и воспринимает изображения, какие существуют методы и инструменты для визуализации данных из различных областей. После освоения дисциплины студенты смогут применять визуальные представления для анализа и понимания сложных данных и разрабатывать собственные интерактивные визуализации.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *