Сегодня 2 января, пятница ГлавнаяНовостиО проектеЛичный кабинетПомощьКонтакты Сделать стартовойКарта сайтаНаписать администрации
Поиск по сайту
 
Ваше мнение
Какой рейтинг вас больше интересует?
 
 
 
 
 
Проголосовало: 7281
Кнопка
BlogRider.ru - Каталог блогов Рунета
получить код
Человек-Хэмингуэй
Человек-Хэмингуэй
Голосов: 2
Адрес блога: http://kvisaz.ru
Добавлен: 2007-12-13 21:24:07 блограйдером Luber
 

Data Mining для чайников

2011-07-17 22:35:52 (читать в оригинале)

Я хотел бы читать фантастику, в которой люди колонизируют планеты. Колонизация планет, можно выживание колонистов. Я уверен, что таких книг сейчас море, учитывая океаны самиздата. Но проблема в том, как их искать в этих океанах?

Человек или небелковое существо, которое выполнит тотальный перебор хотя бы самиздата и создаст подборку "Романы про колонизацию планет, ближних и дальних", сделает очень ценную работу. Нишевую, на нескольких любителей для меня, но очень ценную. Это и есть Data Mining в самой простой и понятной его ипостаси.

Data Mining по определению работает с большими базами данных, с необъятными выборками, от края до края которых человеку можно лететь годами. Так, я уверен, сейчас невозможно одному читателю охватить всю фантастику, бумажную и электронную, чтобы составить подборку "Колонизация планет". Или "Модификация разума". Или "Зомби в кровавом угаре".

Если идти дальше, то Data Mining предполагает не только составление подборки, но и выяснение связей между её объектами. То есть, между книгами выясняются дополнительные логические связи, устанавливается хронология. Теоретически, из множества фантастических романов можно составить непротиворечивую вселенную. Типа, о колонизации Марса описывает книга "Зомби Олимпа" автора N, а о колонизации Фобоса и Деймоса - фанфик по игре "Дум 3" от школьника Васечкина. И читая их, получаешь ощущение цельной картины и непротиворечивости. Но это уже Data Mining такого высокого класса, что вряд ли можно осуществлять в промышленных масштабах. Нет, конечно, вручную можно подобрать список из пяти или десяти книг, но чтобы вечно пополняемый список.... наверно это уже чистая фантастика.

Я пошутил, высший класс в Data Mining - это не просто подбор непротиворечивой картины, а установка родственных связей между героями разных книг от разных авторов. Поиск одной из непротиворечивой модели связей, хотя бы. Это уже точно фантастика.

Но для всех нас, обычных людей и чайников, было бы здорово, если бы кто-то или что-то выполнял хотя бы такую работу - по составлению необычных подборок. И это касается не только книг.

Потому что человеку не нужны все знания, ему нужна удачная подборка.


Тэги: заметка

 


Самый-самый блог
Блогер ЖЖ все стерпит
ЖЖ все стерпит
по количеству голосов (152) в категории «Истории»
Изменения рейтинга
Категория «Новости»
Взлеты Топ 5
Падения Топ 5


Загрузка...Загрузка...
BlogRider.ru не имеет отношения к публикуемым в записях блогов материалам. Все записи
взяты из открытых общедоступных источников и являются собственностью их авторов.