Наши партнеры

Мои книги

"OpenOffice.org - открытый офис для Linux и Windows"

"Свободная система для свободных людей (обзор истории операционной системы Linux)"

"Система виртуальных машин фирмы VMWARE"

Библиотека сайта rus-linux.net

10 лучших программных продуктов с открытым исходным кодом для работы в области искуственного интеллекта в Linux

Оригинал: 10 Top Open Source Artificial Intelligence Tools for Linux
Автор: Aaron Kili
Дата публикации: 21 сентября 2016 года
Перевод: А. Кривошей
Дата перевода: февраль 2017 г.

В этом обзоре мы расмотрим несколько лучших программных продуктов с открытым исходным кодом для работы в области искуственного интеллекта (AI) в Linux. Сегодня AI является одной из наиболее перспективных областей в науке и технологии, с фокусом на создание программ и железа для решения повседневных задач в таких отраслях, как здравоохранение, образование, безопасность, производство, банковская сфера и многое другое.

Ниже кратко описаны платформы, созданные и разрабатываемые для поддержки AI, которые вы можете использовать как в Linux, так и во многих других операционных системах.

1. Deep Learning For Java (Deeplearning4j)

Deeplearning4j - это распределенная библиотека deep-learning коммерческого уровня с открытым исходным кодом для языков программирования Java и Scala. Она разработана специально для бизнес-приложений и интегрирована с Hadoop и Spark.
DL4J распространяется под лицензией Apache 2.0, обеспечивает поддержку GPU и адаптирована для микросервисной архитектуры.

Deep Learning For Java

Домашняя страница: http://deeplearning4j.org/

2. Caffe - фреймворк для глубокого обучения

Caffe - это модульный фреймворк для глубокого обучения, ориентированный на обеспечение высокой скорости вычислений. Он распространяется под лицензией BSD 2-Clause и уже поддерживается несколькими командами проектов по обработке данных в промышленности и мультимедийной сфере.

Caffe

Домашняя страница: http://caffe.berkeleyvision.org/

3. H20 – распределенный фреймворк для машинного обучения

H20 - это быстрый, масштабируемый распределенный фреймворк машинного обучения с открытым исходным кодом плюс набор алгоритмов. Он поддерживает такие востребованные в настоящее время методики машинного обучения, как deep learning, gradient boosting, random forests, generalized linear modeling (т.е. логистическая регрессия, Elastic Net) и многие другие.
Это бизнес-ориентированный инструментарий для работы с данными.

H20

Домашняя страница: http://www.h2o.ai/

4. MLlib – Библиотека машинного обучения

MLlib - это простая в использовании и высокопроизводительная библиотека машинного обучения с открытым исходным кодом, разработанная как часть проекта Apache Spark. Она легко развертывается и может работать с имеющимися кластерами Hadoop.

Также MLlib поставляется с набором алгоритмов классификации, регрессии, рекомендаций, кластеризации и т.д. Важно, что могут использоваться языки программирования Python, Java, Scala и R.

MLlib

Домашняя страница: https://spark.apache.org/mllib/

5. Apache Mahout

Mahout - это фреймворк с открытым исходным кодом, созданный для построения масштабируемых приложений машинного обучения. Он обладает следующими возможностями:
- предоставляет простую и расширяемую среду программирования;
- предлагает большой набор собранных в пакеты алгоритмов для Scala + Apache Spark, H20, а также Apache Flink;
- включает Samaras - векторную математическую среду с R-подобным синтаксисом.

Mahout

Домашняя страница: http://mahout.apache.org//

6. Open Neural Networks Library (OpenNN)

OpenNN - это библиотека с открытым исходным кодом, написанная на С++, для глубокого обучения, она используется для работы с нейронными сетями. Однако, библиотека подходит только опытным программистам C++, также хорошо знающим машинное обучение. Она характеризуется сложной архитектурой и высокой производительностью.

OpenNN

Домашняя страница: http://www.opennn.net/

7. Oryx 2

Oryx 2 - это продолжение изначального проекта Oryx, он разработан на Apache Spark и Apache Kafka как переработка лямбда-архитектуры, хотя фокусируется на машинное обучение в режиме реального времени. Это платформа для разработки приложений в таких областях, как коллаборативная фильтрация, классификация, регрессия и кластеризация.

Oryx 2

Домашняя страница: http://oryx.io/

8. OpenCyc

OpenCyc - это портал с открытым исходным кодом к самой большой и подробной базе общих знаний и движок здравого смысла. Он включает большое количество определений для применения в таких областях, как:
- предметно-ориентированные экспертные системы;
- понимание текста;
- семантическая интеграция данных плюс AI в играх и многое другое.

OpenCyc

Домашняя страница: http://www.cyc.com/platform/opencyc/

9. Apache SystemML

SystemML - это платформа искуственного интеллекта и машинного обучения, идеальная для работы с большими объемами данных. Ее главные возможности - работа с R и Python-подобным синтаксисом, фокус на big data и ориентация на сложную математику. Как она работает, хорошо объясняется на домашней странице.
Имеется несколько способов взаимодействия с Apache Spark, Apache Hadoop, Jupyter и Apache Zeppelin.

SystemML

Домашняя страница: http://systemml.apache.org/

10. NuPIC

NuPIC - это фремворк машинного обучения с открытым исходным кодом на базе Heirarchical Temporary Memory (HTM). Программа HTM интегрирована в NuPIC и предназначена для анализа поступающих в режиме реального времени и выделения в них паттернов.
Основные возможности:
- непрерывное онлайновое обучение;
- обработка поступающих данных в режиме реального времени;
- прогнозирование и моделирование;
- мощный алгоритм определения аномалий.

NuPIC

Домашняя страница: http://numenta.org/