идеи проектов с машинным обучением
Идеи проектов машинного обучения для начинающих
В 2021 году навыки машинного обучения остаются важными. Если вы новичок, необходимо работать над проектами, которые помогут прокачать навыки. Сайт tproger.ru собрал несколько идей для портфолио.
Система музыкальных рекомендаций
Цель этого проекта машинного обучения — рекомендовать пользователям музыку, опираясь на поиск и старые треки, как делает, например Spotify. В какой-то мере, компьютер должен думать примерно, как человек, чтобы выдать релевантный результат. Для этого полезно полагаться на методы машинного обучения и нейронных сетей.
Системы музыкальных рекомендаций бывают нескольких типов. Контент-ориентированные берут за основу прошлый выбор пользователя. Коллаборативные предсказывают песни, основанные на том, что ранее слушали другие люди с похожим вкусом. Гибридные используют оба типа данных. Независимо от типа для обучения системы понадобится датасет. Например, Million Songs, содержащий информацию о разных музыкальных жанрах.
Кстати, потом по такому же принципу можно создать софт, который будет рекомендовать фильмы, сериалы, товары, мероприятия и так далее.
Система прогнозирования продаж
Цель — прогнозировать продажи для каждого отдела в каждой торговой точке. Оно нужно, чтобы помочь компании принимать более эффективные решения для оптимизации каналов и планирования запасов. Для тренировки можно использовать датасеты Walmart, которые содержат данные о продажах 98 продуктов в 45 торговых точках. В них есть информация о каждом магазине, в каждом отделе и на каждый день недели. А также — данные об акциях и скидках, которые влияют на продажи и которые тоже стоит принимать во внимание.
Система прогнозирования цен на жильё
Цель — спрогнозировать стоимость нового дома, на основе данных о ценах на жильё и фактах о доме: пощади, расположении, инфраструктуре и так далее. Чтобы начать, можете использовать датасет Boston House Prices. Он небольшой, но включает достаточно данных для первого проекта машинного обучения. В нём есть информация о ценах на дома Бостона, возрасте владельцев, уровне преступности в районе и так далее — всего 14 показателей.
Анализатор настроений
Имея при себе систему, которая могла бы анализировать настроения, стоящие по текстам и постам, организации могли бы куда точнее понимать поведение потребителей. Это позволило бы им улучшить обслуживание клиентов.
Социальные платформы, например Twitter, Facebook, YouTube и Reddit, генерируют огромное количество данных. Так, используя датасет Twitter, можно получить содержимое твитов, а также информацию о хэштегах, ретвитах, местоположении, пользователя — словом, обо всём, что можно использовать для обучения системы. С ним можно понять, о чём сейчас говорит мир и как относится к актуальным событиям и модным трендам. Работа с таким датасетом разобраться с интеллектуальным анализом данных в соцсетях и классификаторах.
Анализатор активности
Этот проект машинного обучения направлен на построение модели, которая может точно распознавать физическую активность человека. Цель в том, чтобы классифицировать деятельность по одной из шести категорий, которые будет распознавать смартфон. Эти категории: ходьба, бег, подъём и спуск по ступенькам, сидение, стояние и лежание.
Например, здесь датасет содержит информацию об активности 30 людей — её получили с помощью смартфона, оснащённого специальными трекерами.
Система распознавания рукописного ввода
Прежде чем переходить к глубокому обучению, можно создать проект на основе простого датасета, например MNIST. Он предназначен для обучения машин распознаванию рукописных цифр и подойдёт для новичков, которым пока трудно работать с графическими данными.
В этом проекте будем использовать сверточные нейронные сети и датасет MNIST. В нём 60 тысяч обучающих изображений рукописных цифр от нуля до девяти и 10 тысяч изображений для тестирования. При этом он достаточно лёгкий, чтобы поместиться в памяти компьютера.
Система распознавания объектов
Обнаружение объектов — метод компьютерного зрения, который позволяет идентифицировать и находить объекты на изображении или видео. Его можно использовать для подсчёта объектов в сцене и отслеживания их точного расположения. Так, система подойдёт для наблюдения за футбольным мячом или подсчёта машин на дороге.
В разработке проекта помогут глубокие нейронные сети (DNNs). В ходе работы придётся создать модель, способную классифицировать объекты и точно локализовать объекты разных классов.
Идеи проектов машинного обучения для начинающих
Авторизуйтесь
Идеи проектов машинного обучения для начинающих
В 2021 году навыки машинного обучения остаются важными. Если вы новичок, необходимо работать над проектами, которые помогут прокачать навыки. Предлагаем несколько идей для портфолио. А ещё советуем посмотреть нашу подборку готовых датасетов.
Система музыкальных рекомендаций
Цель этого проекта машинного обучения — рекомендовать пользователям музыку, опираясь на поиск и старые треки, как делает, например Spotify. В какой-то мере, компьютер должен думать примерно, как человек, чтобы выдать релевантный результат. Для этого полезно полагаться на методы машинного обучения и нейронных сетей.
Системы музыкальных рекомендаций бывают нескольких типов. Контент-ориентированные берут за основу прошлый выбор пользователя. Коллаборативные предсказывают песни, основанные на том, что ранее слушали другие люди с похожим вкусом. Гибридные используют оба типа данных. Независимо от типа для обучения системы понадобится датасет. Например, Million Songs, содержащий информацию о разных музыкальных жанрах.
Кстати, потом по такому же принципу можно создать софт, который будет рекомендовать фильмы, сериалы, товары, мероприятия и так далее.
Система прогнозирования продаж
Цель — прогнозировать продажи для каждого отдела в каждой торговой точке. Оно нужно, чтобы помочь компании принимать более эффективные решения для оптимизации каналов и планирования запасов. Для тренировки можно использовать датасеты Walmart, которые содержат данные о продажах 98 продуктов в 45 торговых точках. В них есть информация о каждом магазине, в каждом отделе и на каждый день недели. А также — данные об акциях и скидках, которые влияют на продажи и которые тоже стоит принимать во внимание.
Система прогнозирования цен на жильё
Цель — спрогнозировать стоимость нового дома, на основе данных о ценах на жильё и фактах о доме: пощади, расположении, инфраструктуре и так далее. Чтобы начать, можете использовать датасет Boston House Prices. Он небольшой, но включает достаточно данных для первого проекта машинного обучения. В нём есть информация о ценах на дома Бостона, возрасте владельцев, уровне преступности в районе и так далее — всего 14 показателей.
Анализатор настроений
Имея при себе систему, которая могла бы анализировать настроения, стоящие по текстам и постам, организации могли бы куда точнее понимать поведение потребителей. Это позволило бы им улучшить обслуживание клиентов.
Социальные платформы, например Twitter, Facebook, YouTube и Reddit, генерируют огромное количество данных. Так, используя датасет Twitter, можно получить содержимое твитов, а также информацию о хэштегах, ретвитах, местоположении, пользователя — словом, обо всём, что можно использовать для обучения системы. С ним можно понять, о чём сейчас говорит мир и как относится к актуальным событиям и модным трендам. Работа с таким датасетом разобраться с интеллектуальным анализом данных в соцсетях и классификаторах.
Анализатор активности
Этот проект машинного обучения направлен на построение модели, которая может точно распознавать физическую активность человека. Цель в том, чтобы классифицировать деятельность по одной из шести категорий, которые будет распознавать смартфон. Эти категории: ходьба, бег, подъём и спуск по ступенькам, сидение, стояние и лежание.
Например, здесь датасет содержит информацию об активности 30 людей — её получили с помощью смартфона, оснащённого специальными трекерами.
Система распознавания рукописного ввода
Прежде чем переходить к глубокому обучению, можно создать проект на основе простого датасета, например MNIST. Он предназначен для обучения машин распознаванию рукописных цифр и подойдёт для новичков, которым пока трудно работать с графическими данными.
В этом проекте будем использовать сверточные нейронные сети и датасет MNIST. В нём 60 тысяч обучающих изображений рукописных цифр от нуля до девяти и 10 тысяч изображений для тестирования. При этом он достаточно лёгкий, чтобы поместиться в памяти компьютера.
Система распознавания объектов
Обнаружение объектов — метод компьютерного зрения, который позволяет идентифицировать и находить объекты на изображении или видео. Его можно использовать для подсчёта объектов в сцене и отслеживания их точного расположения. Так, система подойдёт для наблюдения за футбольным мячом или подсчёта машин на дороге.
В разработке проекта помогут глубокие нейронные сети (DNNs). В ходе работы придётся создать модель, способную классифицировать объекты и точно локализовать объекты разных классов.
5 мощных проектов по машинному обучению для начинающих
В этой статье мы расскажем о пяти идеях, используя которые вы сможете реализовать действительно хорошие проекты по машинному обучению. (Источник — 8 Fun Machine Learning Projects for Beginners, перевод опубликовал сайт proglib.io).
Как вы знаете, количество изученного теоретического материала не может заменить практику. Теоретические уроки и книги могут внушить вам ложное представление о том, что вы достаточно изучили материал и хорошо разбираетесь в теме. Однако как только вы попробуете применить полученные знания, вы поймёте, что материал на деле сложнее, чем в теории.
Эти проекты помогут вам усовершенствовать навыки по машинному обучению и изучить новые темы. К тому же, выполненные проекты прекрасно дополнят ваше портфолио, что будет плюсом при трудоустройстве.
Поработайте с финансовыми рынками
Финансовый рынок — отличная вещь для любого Data Scientist, даже для того, кто далек от финансовой сферы.
Во-первых, у вас есть огромный выбор: вы можете работать с ценами, фундаментальными данными, глобальными макроэкономическими показателями, индексами волатильности и т. д.
Во-вторых, данные могут быть очень подробными. Вы можете с лёгкостью получить данные любой компании по дню (или даже минуте). Это поможет вам творчески обдумывать торговые стратегии.
Наконец, финансовые рынки имеют короткие циклы отклика, поэтому вы сможете быстро перестроить прогноз под новые данные.
Некоторые идеи для проекта:
Очевидно, что написание подобных проектов лишь для практики в машинном обучении — простая вещь. Однако монетизация, извлечение материальной выгоды из подобных проектов — максимально сложная практика. Ничего из вышесказанного не является финансовым советом, и мы крайне не рекомендуем торговать реальной валютой, если вы не разбираетесь в рынках.
Плейлист видео по машинному обучению, применяемому для инвестирования.
Источники данных:
Рынок данных, который предоставляет бесплатные (и премиум) финансовые и экономические данные. Например, вы можете скачать цены на конец дня для более 3000 американских компаний или экономические данные из Федерального резерва.
Количественное финансовое сообщество, которое предлагает бесплатную платформу для разработки алгоритма торговли. Включает в себя наборы данных.
Фундаментальные данные 5000+ американских компаний за последний 5 лет.
Создайте нейросеть, которая распознаёт текст, написанный от руки
Нейронные сети и Deep Learning — два главных прорыва в развитии современного искусственного интеллекта. Они привели к большим достижениям в области распознавания объектов (прочитайте нашу статью про распознавание объектов на Python), генерации текстов и даже в области беспилотных автомобилей.
Чтобы больше углубиться в эту тему, вам стоит начать с чего-то попроще, не с изображений.
MNIST Handwritten Digit Classification Challenge — стандартная точка входа. С изображениями работать гораздо сложнее, чем с реляционными моделями данных. MNIST данные дружелюбны по отношению к новичкам и имеют небольшие размеры, так что с лёгкостью поместятся на одном компьютере.
Для начала мы рекомендуем начать с первой главы обучения ниже. Там вы научитесь создавать нейросеть на Python с нуля, которая будет распознавать письменный текст с большой точностью.
Источник данных:
Исследуйте Enron
Скандал Enron был самым большим корпоративным кризисом в истории.
В 2000 Enron была одной из самых больших энергетических компаний в Америке. Затем, когда компанию уличили в мошеннических махинациях, она обанкротилась в течение года.
К счастью для нас, есть данные e-mail переписок бывших сотрудников Enron. Это 500 тысяч электронных писем между 150 бывшими сотрудниками, в основном, старшими руководителями. Это также единственная крупнейшая публичная база данных электронных писем, что делает её ещё более ценной.
Фактически, Data Scientist используют этот набор данных уже много лет для проектов по машинному обучению.
Проекты по машинному обучению, которые вы можете попробовать реализовать:
Источники данных:
Улучшите заботу о здоровье
Ещё одна отрасль, которая активно развивается благодаря проектам по машинному обучению — это здравоохранение и забота о здоровье.
Во многих странах для того, чтобы стать доктором, необходимо потратить много лет на обучение. Порог вхождения в эту сферу довольно велик, а процесс становления врачом очень сложен.
В результате в последнее время предпринимаются значительные усилия для облегчения рабочей нагрузки врачей и повышения общей эффективности системы здравоохранения с помощью машинного обучения.
Возможные проекты:
Гайды:
Источники данных:
Анализируйте социальные медиа
Социальные медиа уже практически стали синонимом “big data” из-за огромного количества контента, создаваемого пользователями.
Добыча этих данных — беспрецедентный способ сохранить руку на пульсе общественного мнения, настроения и трендов. Facebook, Twitter, YouTube, WeChat, WhatsApp, Reddit… Список можно продолжать и продолжать.
Кроме того, каждое последующее поколение тратит ещё больше времени на соцсети, чем предыдущее. Это значит, что данные в социальных сетях станут ещё более актуальными для маркетинга, брендов и бизнеса в целом.
Несмотря на то, что существует множество популярных социальных сетей, Twitter является классической точкой входа в практику машинного обучения.
С данными Twitter вы получаете интересное сочетание данных (содержимое твитов) и метаданных (местоположение, хештеги, пользователи, повторные твиты и т. д.), которые открывают вам почти бесконечное количество путей для анализа.
8 ML/AI-проектов, которые украсят ваше портфолио
Автор материала, перевод которого мы сегодня публикуем, предлагает вниманию читателей 8 идей проектов в сферах машинного обучения и искусственного интеллекта. Описание идей сопровождается ссылками на дополнительные материалы. Реализации этих идей способны украсить портфолио проектов профильного специалиста.
1. Анализ эмоциональной окраски сообщений в социальных сетях и поиск признаков депрессии
По данным Всемирной организации здравоохранения депрессия — это серьёзнейшая проблема, которая нуждается в срочном решении. Более 264 миллионов человек в мире страдает от депрессии. Депрессия — это основная причина инвалидности в мире, она вносит значительный «вклад» в глобальное бремя болезней. Из-за депрессии в мире ежегодно более 800000 человек погибает от самоубийства. Это — вторая по значимости причина смерти людей в возрасте 15-29 лет. Лечение от депрессии часто начинается позже, чем нужно, такое лечение может быть основано на неточном диагнозе, а иногда от депрессии и вовсе не лечат.
То, что интернет прочно вошёл в жизнь современного человека, даёт обществу уникальный шанс раннего выявления признаков депрессии. Особенно это касается нахождения подобных признаков среди молодёжи. Если говорить только о Twitter, то окажется, что каждую секунду пользователи этой социальной сети публикуют около 6000 твитов. Это значит, что в минуту публикуется около 350000 твитов, в день — около 500 миллионов, а в год — около 200 миллиардов.
По сведениям Pew Research Center около 72% взрослых людей, пользующихся интернетом, являются пользователями социальных сетей. Наборы данных, взятые из социальных сетей, важны во многих сферах исследований. Например — в области наук о человеке и в медицинских изысканиях. В наши дни поддержка подобных исследований через анализ данных из социальных сетей находится на зачаточном уровне, а существующие методы анализа таких данных неэффективны.
Анализируя лингвистические маркеры в публикациях из социальных сетей, можно создать модель, основанную на технологии глубокого обучения, которая может выявлять признаки депрессии у конкретного пользователя сети раньше, чем традиционные методы.
Вот несколько материалов по теме:
2. Формирование текстовых сводок по видеозаписям спортивных матчей с использованием нейронных сетей
Идея этого проекта заключается в формировании точных текстовых сводок по видеозаписям спортивных матчей. Существуют сайты, которые специализируются на предоставлении пользователям сведений о матчах. Предложены различные модели, направленные на извлечение из видеозаписей информации о матчах и представление её в текстовом виде. Лучше всего с этой задачей справляются нейронные сети. Под «формированием текстовых сводок» обычно понимают представление информации в сжатом виде, с уделением особого внимания тому, что несёт факты и важные сведения о событии.
Для решения задачи автоматического создания описания игр по записям необходимо сделать так, чтобы модели, решающие эту задачу, могли бы распознавать особенно важные и захватывающие моменты игр.
Достичь этого можно, используя некоторые методики глубокого обучения, наподобие трёхмерных свёрточных нейронных сетей (3D-CNN), рекуррентных нейронных сетей (RNN), сетей долгой краткосрочной памяти (LTSM). Здесь находят применение и другие алгоритмы машинного обучения, вроде метода опорных векторов (SVM) и метода k-средних. В ходе применения таких алгоритмов видео разбивают на части, которые обрабатывают с помощью соответствующих моделей.
Вот материал, посвящённый классификации сцен спортивных видеозаписей для целей формирования сводок по ним с использованием технологии переноса обучения (transfer learning).
3. Система решения уравнений, записанных от руки, основанная на свёрточных нейронных сетях
Распознавание рукописных математических выражений — это одна из сложных задач, стоящих перед теми, кто занимается исследованиями в области машинного зрения. Создать систему, которая способна распознать рукописное математическое выражение, можно, воспользовавшись свёрточными нейронными сетями (CNN) и некоторыми методами обработки изображений. Разработка подобной системы подразумевает обучение сети с использованием соответствующим образом подготовленных наборов данных, представленных рукописными математическими символами.
Вот некоторые материалы по этой теме:
4. Формирование кратких отчётов по материалам деловых встреч с использованием технологий обработки естественного языка
Вы попадали когда-нибудь в ситуацию, когда некий длинный материал нужно свести к краткому конспекту? Мне приходилось с этим сталкиваться во время учёбы. А именно, мне нужно было тратить много времени на подготовку какого-нибудь длинного реферата, а у преподавателя было время лишь на то, чтобы прочитать его краткую аннотацию, на подготовку которой тоже приходилось тратить время.
Механизмы подготовки кратких сводок по каким-то материалам возникли как попытка решения проблемы информационной перегрузки, которой подвержен современный человек. Система извлечения самой ценной информации, например, из записи неких переговоров или лекций, может иметь большую коммерческую и образовательную ценность. К разработке подобной системы можно подойти, применив разносторонний анализ текстовой информации, имеющей отношение к диалогам и монологам.
Ручное составление краткой сводки некоего отчёта занимает очень много времени. Но эту задачу можно решить с помощью технологий обработки естественного языка (NLP).
Для подготовки краткой аннотации текста можно воспользоваться механизмами, основанными на глубоком обучении, способными «понять» контекст всего текста. Многие были бы просто счастливы, окажись в их распоряжении система, способная быстро и качественно решать подобные задачи.
Вот статьи об этом:
5. Реализация системы, которая распознаёт лица пользователей, определяет их настроение и предлагает им соответствующую музыку
На лице человека отражается его внутреннее состояние, по лицу можно понять то, какие эмоции испытывает человек. На этих сведениях, например, может быть основана система автоматического подбора музыки. Дело в том, что то, какую именно музыку слушают люди, часто зависит от их настроения. Поэтому вполне логично предположить, что у системы, способной «понимать» настроение человека и подбирать ему подходящую музыку, есть будущее. В решении этой задачи нам могут помочь технологии машинного зрения. Они, в деле распознавания эмоций, предусматривают анализ фотографий или видеофрагментов.
Уже созданы API для решения подобных задач, которые я считают интересными и полезными, хотя поработать мне с ними пока не довелось. Вот материал о таких API.
6. Поиск обитаемых экзопланет, выполняемый на основе изображений, снятых космическими устройствами вроде телескопа Кеплер
В последнее десятилетие проведено исследование огромного количества звёзд на предмет наличия около них планет, которые могут быть обитаемыми. Ручной анализ данных, позволяющий выявлять экзопланеты, чрезвычайно трудоёмок и подвержен человеческим ошибкам. Для решения задачи поиска подобных планет хорошо подходят свёрточные нейронные сети
7. Восстановление старых повреждённых фотографий
Восстановление старых фотографий — тяжёлая работа. Эту работу можно облегчить, воспользовавшись технологиями глубокого обучения. Соответствующая система может автоматически обнаруживать повреждения снимков (изломы, потёртости, дыры) и, используя алгоритмы реконструкции изображений (Inpainting), от повреждений избавляться, восстанавливая утраченные части фотографий.
Вот материалы по теме:
8. Создание музыки с использованием технологий глубокого обучения
Музыка — это набор звуков разной частоты. Зная об этом, можно описать автоматическое создание музыки как процесс создания небольших музыкальных фрагментов с минимальным участием человека. В наши дни специалисты, занимающиеся машинным обучением, находятся на переднем крае технологий компьютерного создания музыки.
Вот пара полезных материалов об этом:
Итоги
Мы рассмотрели восемь перспективных идей, которые могут лечь в основу проектов, способных обогатить портфолио проектов того, кто занимается искусственным интеллектом и машинным обучением. Надеемся, вы нашли среди этих идей что-то такое, что вас вдохновило.
Планируете ли вы реализовать какую-нибудь из вышеописанных идей?
30 самых удивительных проектов по машинному обучению
Ex-редактор направления «Истории».
Платформа Mybridge проанализировала около 8800 прошлогодних проектов по машинному обучению с открытым исходным кодом и выбрала топ-30. В этом списке перечислены лучшие библиотеки для машинного обучения, датасеты и приложения, опубликованные в период с января по декабрь 2017 года. При оценке учитывались популярность, новизна и активность.
1. FastText
Библиотека для изучения вложений слов и текстовой классификации. [11786 звезд на Github] Создатель – Facebook Research.
2. Deep Photo Style Transfer
Программа для рендеринга фотографий с перенесением стилей с помощью нейросетей. [9747 звезд на Github] Создатель – Фудзюн Луань, профессор Корнеллского университета.
3. Face Recognition
Самый простой API для распознавания лиц для Python. [8672 звезды на Github] Создатель –Адам Гейтгей.
4. Magneta
Генерация музыки и живописи при помощи машинного интеллекта. [8113 звезд на Github].
5. Sonnet
Библиотека для работы с нейронными сетями, основанная на TensorFlow. [5731 звезда на Github] Создатель – Малкольм Рейнолдс из Deepmind.
6. deeplearn.js
Библиотека для машинного обучения, которая работает в браузере. [5462 звезды на Github] Создатель – Нихил Торат из Google Brain.
7. Fast Style Transfer in TensorFlow
Быстрая передача стиля с помощью TensorFlow. [4843 звезды на Github] Создатель – Логан Энгсторм из Массачусетского технологического института.
8. Pysc2
Среда обучения для StarCraft II. [3683 звезды на Github] Создатель – Тимо Эвальдс из DeepMind.
9. AirSim
Проект с открытым исходным кодом, созданный на Unreal Engine, который моделирует физику полета мультикоптера. [3861 звезда на Github] Создатель – Шитал Шах из Microsoft.
10. Facets
Визуализации для датасетов машинного обучения. [3371 звезда на Github] Создатель – Google Brain.
11. Style2Paints
ИИ-раскраска изображений. [3310 звезд на Github].
12. Tensor2Tensor
Унифицированная модель глубинного обучения, которая способна решать задачи из разных областей – Google Research. [3087 звезд на Github] Создатель – Райан Сепасси из Google Brain.
13. Image-to-image translation in PyTorch
Image-to-image трансформация рисунков. Например, трансформация лошадей в зебр, картины Моне — в фотографию, летнего пейзажа — в зимний и т.д. [2847 звезд на Github] Создатель – Дзюн-Ян Зу, профессор Калифорнийского университета в Беркли.
14. Faiss
Библиотека для эффективного поиска подобия и кластеризации векторов. [2629 звезд на Github] Создатель – Facebook Research.
15. Fashion-mnist
База данных продуктов моды для машинного обучения. [2780 звезд на Github] Создатель – Хань Сяо, исследователь Zalando Tech.
16. ParlAI
Основа для обучения и оценки моделей ИИ на наборе данных из множества диалогов. [2578 звезд на Github] Создатель – Александр Миллер из Facebook Research.
17. Fairseq
Сверточная нейронная сеть для машинного перевода. [2571 звезда на Github] Создатель – Facebook AI.
18. Pyro
Глубокое универсальное вероятностное программирование с Python и PyTorch. [2387 звезд на Github] Создатель – Uber AI Labs.
19. iGAN
Интерактивная генерация изображений. [2369 звезд на Github].
20. Deep-image-prior
Восстановление изображений с помощью нейронных сетей, но без обучения. [2188 звезд на Github] Создатель – Дмитрий Ульянов из Сколковского института науки и технологий.
21. Face_classification
Обнаружение лиц в реальном времени и эмоциональная/гендерная классификация с использованием наборов данных fer2013/IMDB. [1967 звезд на Github].
22. Speech-to-Text-WaveNet
End-to-end распознавание речи на английском языке с использованием WaveNet и tensorflow. [1961 звезда на Github] Создатель – Намджу Ким из Kakao Brain.
23. StarGAN
24. ML-agents
Плагин с открытым кодом, который является средой для обучения агентов в Unity. [1658 звезд на Github] Создатель – Артур Юлиани.
25. DeepVideoAnalytics
Платформа для поиска и аналитики визуальных данных. [1494 звезды на Github] Создатель – Акшай Бхат, профессор Корнеллского университета.
26. OpenNMT
Открытая система машинного перевода, использующая методы машинного обучения. Для построения нейронной сети проект использует возможности библиотеки глубинного машинного обучения Torch. [1490 звезд на Github].
27. Pix2pixHD
Фотореалистичный синтез и преобразование изображений с высоким разрешением (2048×1024). [1283 звезды на Github] Создатель – Мин-Ю Лиу из Nvidia.
28. Horovod
Фреймворк распределенного обучения для TensorFlow. [1188 звезд на Github] Создатель – Uber Engineering.
29. AI-Blocks
Мощный и интуитивно понятный WYSIWYG-интерфейс, который позволяет любому человеку создавать модели для машинного обучения. [899 звезд на Github].
30. Deep neural networks for voice conversion in Tensorflow
Глубокие нейронные сети для передачи стиля голоса. [845 звезд на Github]. Создатель – Даби Ань из Kakao Brain.
Расскажи, как цифровая трансформация изменила твой бизнес