Опубликовано несколько новых открытых проектов в области машинного обучения:- DeOldify (https://github.com/jantic/DeOldify) - проект, использующий наработки в области глубинного машинного обучения для автоматического раскрашивания чёрно-белых фотографий и восстановления качества старых изображений. Основной системы является генеративно-состязательная (https://ru.wikipedia.org/wiki/%D0%93%D0%... сеть (GAN), включающая две нейронные сети - одна генерирует образцы, а вторая отбраковывает недостаточно реалистичные результаты.
В разработке используются библиотеки Fast.AI (https://github.com/jantic/fastai), PyTorch (https://pytorch.org/) и Tensorboard (https://github.com/lanpa/tensorboardX) (надстройка над Tensorflow для PyTorch). Модель обучена на структурированной коллекции изображений ImageNet (http://image-net.org/download). Для повышения качества фотографий используется та же модель, что и для раскраски, которая расширена элементами для корректировки яркости и контраста и обучена с использованием симуляции выцветших фотографий и фотографий снятых на старые или плохие фотоаппараты. Код проекта опубликован (https://github.com/jantic/DeOldify) под лицензией MIT.
- Компания Facebook открыла (https://code.fb.com/ml-applications/horizon/) исходные тексты платформы Horizon (https://research.fb.com/publications/horizon-facebooks-open-... которая преподносится как первая платформа обучения с подкреплением (https://ru.wikipedia.org/wiki/%D0%9E%D0%... (RL), которую можно использовать для оптимизации систем в крупных промышленных окружениях. Horizon уже более года используется в различных приложениях Facebook для решения таких задач, как персонализация рекомендаций в мессенджере, принятие решений о частоте и доставке уведомлений (пользователь получает только наиболее релевантные уведомления о новых публикациях и комментариях) и оптимизация качества потокового видео (выбор битрейта и корректировка параметров на лету во время воспроизведения видео в режиме 360-градусов на основе оценки качества канала связи и состояния буферизации).
Horizon предоставляет готовые компоненты для обучения с использованием популярных алгоритмов обучения с подкреплением, обработки и преобразования данных, распределённого обучения, выбора оптимальных стратегий и оптимизации. Платформа рассчитана на решение прикладных задач, в которых фигурируют массивы данных в миллионы и миллиарды наблюдений и
достаточно медленный цикл обратной связи (по сравнению с симулятором).
В отличие от других платформ, которые прежде всего рассчитаны на проведение экспериментов и создание исследовательских прототипов, Horizon изначально развивается как готовое решение, пригодное для внедрения на предприятиях.
Платформа использует PyTorch 1.0 (https://github.com/pytorch/pytorch) для моделирования и обучения, и применяет Caffe2 (https://github.com/caffe2/caffe2) для хранения и обработки моделей. Поддерживаются алгоритмы
Q-обучения (https://ru.wikipedia.org/wiki/Q-%D0%BE%D0... (DQN, Deep Q-Network) Discrete-Action DQN, Parametric-Action DQN (https://storage.googleapis.com/deepmind-media/dqn/DQNNatureP... Double DQN (https://arxiv.org/abs/1509.06461), Dueling DQN (https://arxiv.org/abs/1511.06581) и Dueling Double DQN (https://arxiv.org/abs/1710.02298), а также алгоритмы DDPG (https://arxiv.org/abs/1509.02971) (Deep Deterministic Policy Gradient) и SAC (https://arxiv.org/abs/1801.01290) (Soft Actor-Critic). Код платформы написан на языке Python и опубликован (https://github.com/facebookresearch/Horizon) под лицензией BSD.
- Компания Google опубликовала (https://github.com/google-research/bert) реализацию метода машинного обучения BERT (Bidirectional Encoder Representations from Transformers) и готовые натренированные модели к нему. BERT позволяет создавать системы для обработки информации на естественном языке (NLP, Natural Language Processing). Например, BERT может применяться для построения автоответчиков, ботов и различных диалоговых систем, отвечающих на задаваемые вопросы и определяющих смысл фраз.
В тесте SQuAD F1 решение на базе BERT продемонстрировало уровень точности ответов на вопросы в 93.2%, что на 2% лучше, чем результат, полученный при прохождении данного теста человеком. В тесте GLUE система BERT показала уровень точности в 80.4% (на 7.6% лучше прошлого рекорда), в тесте MultiNLI - 86.7% (на 5.6% лучше). Система построена на базе фреймворка TensorFlow и поставляется (https://github.com/google-research/bert) под лицензией Apache 2.0. Для загрузки также доступно несколько натренированных моделей, которые также распространяются под лицензией
Apache 2.0.
URL: https://code.fb.com/ml-applications/horizon/
Новость: https://www.opennet.ru/opennews/art.shtml?num=49550