Какой рейтинг вас больше интересует?
|
Главная /
Каталог блоговCтраница блогера CODE1NSTINCT/Записи в блоге |
Dremel. Как Google считает в real-time?
2013-12-01 20:13:00 (читать в оригинале)Google Platform»
Dremel – масштабируемая система обработки запросов в режиме близком к режиму реального времени (near-real-time), предназначенная для анализа неизменяемых данных [4].
Авторы research paper [4] (среди которых, судя по всему, и наши соотечественники - Сергей Мельник и Андрей Губарев), в котором описываются базовые принципы и архитектура Dremel, заявляют, что система в силах:
- выполнять агрегирующие запросы над боле чем над триллионом строк за секунды;
- масштабируется на тысячи CPU;
- предназначена для работы с петабайтами данных;
- имеет тысячи пользователей внутри Google (дословно «at Google»).
Spanner. NewSQL СУБД от Google
2013-12-01 19:30:00 (читать в оригинале)Google Platform»
Spanner – географически распределенная высокомасштабируемая мультиверсионная база данных с поддержкой распределенных транзакций. База данных была разработана инженерами Google для внутренних сервисов корпорации. Research paper [8], описывающие базовые принципы и архитектуру Spanner, был представлен на научной конференции 10th USENIX Symposium on Operating Systems Design and Implementation в 2012 году.
Spanner является эволюционным развитием NoSQL-предшественника – Google Bigtable. Сам же c Spanner относят к семейству NewSQL-решений. В research paper [8] заявляется, что дизайн Spanner позволяет системе масштабироваться на миллионы вычислительных узлов через сотни дата-центров и работать с триллионами строк данных.
Читать полностьюColossus. Распределенная файловая система от Google
2013-11-28 19:15:00 (читать в оригинале)Google Platform»
Colossus (или GFS2) – это проприетарная распределенная файловая система от Google, запущенная в production-режиме в 2009 году. Colossus является эволюционным развитием GFS. Как и ее предшественник GFS, Colossus оптимизирована для работы с большими наборами данных, прекрасно масштабируется, является высокодоступной и отказоустойчивой системой, а также позволяет надежно хранить данные.
В то же время, Colossus решает часть задач, с которыми GFS не справлялась, и устраняет некоторые узкие места предшественника.
Читать полностьюGoogle MapReduce
2013-11-27 11:52:00 (читать в оригинале)Google Platform»
Общие сведения
MapReduce – это программная модель, описанная инженерами Google в research paper [2], и ассоциированная с этой программной моделью реализация (фреймворк), позволяющий обрабатывать большие объемы данных распределено.
В простейшем случае в программной модели MapReduce выделяют 2 фазы:
- map(ƒ, c): принимает функцию ƒ и список c. Возвращает выходной список, являющийся результатом применения функции ƒ к каждому элементу входного списка c.
- reduce(ƒ, c): принимает функцию ƒ и список c. Возвращает объект, образованный через свертку коллекции c через функцию ƒ.
Bigtable
2013-11-26 21:33:00 (читать в оригинале)Google Platform»
Общие сведения
Bigtable – высокопроизводительная база данных, реализующая колоночную схему хранения и построенная на основе GFS и некоторых других внутренних продуктах Google. Как и GFS, Bigtable – проприетарная система, внутреннее устройство которой, тем не менее, было подробно описано инженерами Google в research paper [3].
Bigtable – хорошо масштабирующееся хранилище данных, рассчитанное на хранение петабайтов информации и работающее на commodity-серверах. Bigtable работает на production-серверах с 2005 года. В разное время в BigTable хранили данные web-индексов, сервисов Google Analytics, Google Earth, Google Finance [3].
Читать полностью
+557 |
564 |
Виктор Имантович Алкснис |
+548 |
625 |
Все для людей |
+520 |
561 |
krodico |
+519 |
560 |
sich |
+500 |
511 |
Выводы простого человека |
-2 |
15 |
dandr |
-6 |
11 |
Записки океанолога |
-7 |
12 |
Internet business in Ukraine |
-8 |
10 |
Markup |
-9 |
73 |
Кукуц Шмукуц |
Загрузка...
взяты из открытых общедоступных источников и являются собственностью их авторов.