состоялся релиз стабильной версии (Generally Available, GA) версии Apache Hadoop 2.x.
состоялся релиз стабильной версии (Generally Available, GA) версии Apache Hadoop 2.x.
Об одном из, безусловно, самых инновационных изменений - вычислительном фреймворке YARN - я уже подробно писал. Кроме этого, к нововведениям Apache Hadoop 2.2.0 относятся:
- HDFS:
- высокая доступность HDFS (напомню, что узел имен NameNode в Hadoop 1.x был единой точкой отказа);
- возможность создания федераций HDFS;
- мгновенные снимки (snapshots) HDFS;
- доступ по протоколу сетевого доступа к файловым системам NFSv3, Network File System.
- Совместимость:
- бинарная совместимость с приложениям созданными под Hadoop 1.x;
- существенное количество интеграционных тестов с элементами экосистемы Hadoop.
- Другое:
- поддержка запуска Hadoop на OS Windows.
Happy data mining!