Библиотека сайта rus-linux.net
10 лучших программных продуктов с открытым исходным кодом для работы в области искуственного интеллекта в Linux
Оригинал: 10 Top Open Source Artificial Intelligence Tools for Linux
Автор: Aaron Kili
Дата публикации: 21 сентября 2016 года
Перевод: А. Кривошей
Дата перевода: февраль 2017 г.
В этом обзоре мы расмотрим несколько лучших программных продуктов с открытым исходным кодом для работы в области искуственного интеллекта (AI) в Linux. Сегодня AI является одной из наиболее перспективных областей в науке и технологии, с фокусом на создание программ и железа для решения повседневных задач в таких отраслях, как здравоохранение, образование, безопасность, производство, банковская сфера и многое другое.
Ниже кратко описаны платформы, созданные и разрабатываемые для поддержки AI, которые вы можете использовать как в Linux, так и во многих других операционных системах.
1. Deep Learning For Java (Deeplearning4j)
Deeplearning4j - это распределенная библиотека deep-learning коммерческого уровня с открытым исходным кодом для языков программирования Java и Scala. Она разработана специально для бизнес-приложений и интегрирована с Hadoop и Spark.
DL4J распространяется под лицензией Apache 2.0, обеспечивает поддержку GPU и адаптирована для микросервисной архитектуры.
Домашняя страница:
2. Caffe - фреймворк для глубокого обучения
Caffe - это модульный фреймворк для глубокого обучения, ориентированный на обеспечение высокой скорости вычислений. Он распространяется под лицензией BSD 2-Clause и уже поддерживается несколькими командами проектов по обработке данных в промышленности и мультимедийной сфере.
Домашняя страница:
3. H20 – распределенный фреймворк для машинного обучения
H20 - это быстрый, масштабируемый распределенный фреймворк машинного обучения с открытым исходным кодом плюс набор алгоритмов. Он поддерживает такие востребованные в настоящее время методики машинного обучения, как deep learning, gradient boosting, random forests, generalized linear modeling (т.е. логистическая регрессия, Elastic Net) и многие другие.
Это бизнес-ориентированный инструментарий для работы с данными.
Домашняя страница:
4. MLlib – Библиотека машинного обучения
MLlib - это простая в использовании и высокопроизводительная библиотека машинного обучения с открытым исходным кодом, разработанная как часть проекта Apache Spark. Она легко развертывается и может работать с имеющимися кластерами Hadoop.
Также MLlib поставляется с набором алгоритмов классификации, регрессии, рекомендаций, кластеризации и т.д. Важно, что могут использоваться языки программирования Python, Java, Scala и R.
Домашняя страница:
5. Apache Mahout
Mahout - это фреймворк с открытым исходным кодом, созданный для построения масштабируемых приложений машинного обучения. Он обладает следующими возможностями:
- предоставляет простую и расширяемую среду программирования;
- предлагает большой набор собранных в пакеты алгоритмов для Scala + Apache Spark, H20, а также Apache Flink;
- включает Samaras - векторную математическую среду с R-подобным синтаксисом.
Домашняя страница:
6. Open Neural Networks Library (OpenNN)
OpenNN - это библиотека с открытым исходным кодом, написанная на С++, для глубокого обучения, она используется для работы с нейронными сетями. Однако, библиотека подходит только опытным программистам C++, также хорошо знающим машинное обучение. Она характеризуется сложной архитектурой и высокой производительностью.
Домашняя страница:
7. Oryx 2
Oryx 2 - это продолжение изначального проекта Oryx, он разработан на Apache Spark и Apache Kafka как переработка лямбда-архитектуры, хотя фокусируется на машинное обучение в режиме реального времени. Это платформа для разработки приложений в таких областях, как коллаборативная фильтрация, классификация, регрессия и кластеризация.
Домашняя страница:
8. OpenCyc
OpenCyc - это портал с открытым исходным кодом к самой большой и подробной базе общих знаний и движок здравого смысла. Он включает большое количество определений для применения в таких областях, как:
- предметно-ориентированные экспертные системы;
- понимание текста;
- семантическая интеграция данных плюс AI в играх и многое другое.
Домашняя страница:
9. Apache SystemML
SystemML - это платформа искуственного интеллекта и машинного обучения, идеальная для работы с большими объемами данных. Ее главные возможности - работа с R и Python-подобным синтаксисом, фокус на big data и ориентация на сложную математику. Как она работает, хорошо объясняется на домашней странице.
Имеется несколько способов взаимодействия с Apache Spark, Apache Hadoop, Jupyter и Apache Zeppelin.
Домашняя страница:
10. NuPIC
NuPIC - это фремворк машинного обучения с открытым исходным кодом на базе Heirarchical Temporary Memory (HTM). Программа HTM интегрирована в NuPIC и предназначена для анализа поступающих в режиме реального времени и выделения в них паттернов.
Основные возможности:
- непрерывное онлайновое обучение;
- обработка поступающих данных в режиме реального времени;
- прогнозирование и моделирование;
- мощный алгоритм определения аномалий.
Домашняя страница: