Сегодня 13 марта, четверг

Какой рейтинг вас больше интересует?

получить код

Главная / Каталог блогов / Cтраница блогера Хабрахабр: Коллективные / Блоги / Захабренные / Запись в блоге

	Хабрахабр: Коллективные / Блоги / Захабренные Голосов: 10 Адрес блога: http://habrahabr.ru/blog/ Добавлен: 2007-10-24 18:05:40 блограйдером Robin_Bad

Data Mining / Spark: дата-майнинг до 30x быстрее Hadoop

2011-06-23 15:22:06 (читать в оригинале)

В Калифорнийском университете в Беркли разработали фреймворк Spark для распределённых вычислений в кластерах. На некоторых задачах он превосходит Hadoop в 10-30 раз, сохраняя при этом масштабируемость и надёжность MapReduce.

Увеличение производительности до 30х возможно на специфических задачах, в которых идёт постоянное обращение к одному и тому же набору данных. Например, это интерактивный дата-майнинг и итерационные алгоритмы, которые активно используются, например, в системах машинного обучения. Собственно, для этих двух задач проект и создавался. Но Spark превосходит Hadoop не только в системах машинного обучения, но и в традиционных приложениях по обработке данных.

Читать дальше →

Тэги: dataset, distributed, hadoop, mapreduce, mesos, rdd, resilient, scala, spark

Блограйдеров
14508

Блогов
219943
(+0 сегодня)

Сообществ
1311
(+0 сегодня)

ЖЖ все стерпит
по сумме баллов (758) в категории «Истории»

Категория «Игры»

Взлеты Топ 5


+376	408	Parazit!
+375	407	ALEXRUS
+370	383	Remi_Etien_Le_Bo
+368	381	Memрhis
+365	382	_Kicker_

Падения Топ 5


-2	5	Накукрыскин
-6	133	Каталог сенсаций
-6	312	W7Phone.ru
-7	4	Tatarnikoff
-11	144	Перший україномовний ігровий портал

Загрузка...

BlogRider.ru не имеет отношения к публикуемым в записях блогов материалам. Все записи
взяты из открытых общедоступных источников и являются собственностью их авторов.