Сегодня 19 апреля, пятница ГлавнаяНовостиО проектеЛичный кабинетПомощьКонтакты Сделать стартовойКарта сайтаНаписать администрации
Поиск по сайту
 
Ваше мнение
Какой рейтинг вас больше интересует?
 
 
 
 
 
Проголосовало: 7272
Кнопка
BlogRider.ru - Каталог блогов Рунета
получить код
V_exeR
V_exeR
Голосов: 5
Адрес блога: http://blog.vexer.ru/
Добавлен: 2007-11-05 17:45:50
Принадлежит блограйдеру v_exer
 

Снова Гарфилд. Тексты стрипов.

2017-01-30 23:42:00 (читать в оригинале)

Как вы и сами прекрасно можете себе представить, реализовать текстовый поиск по четырнадцати с лишним тысячам довольно мелких картинок - задача, мягко говоря, нетривиальная. Выходов мне виделось два: либо энтузиасты со временем помогли бы мне переписать текст со стрипов, либо каким-то образом распознать весь текст программно. У обоих вариантов есть свои огромные «но», и задача оставалась долгие годы нерешённой, пока сайт GoComics не поменял свой дизайн. Где связь? Сейчас поясню.

Ни для кого не секрет, что для перевода стрипов про Гарфилда нужно откуда-то брать их оригиналы. И довольно долгое время я их беру с GoComics. Причём, конечно, не вручную, а автоматически, специальным скриптом. И вот в одно прекрасное утро этот самый скрипт сказал мне «насяльника, не вижу свежей картинки!». Разумеется, пришлось грузить сайт вручную и смотреть, что такое стряслось. А стряслось то, что сайт кардинально поменял дизайн, и комикс теперь грузится не так, не туда и не тогда. Вот чёрт их дёрнул формат менять, всё же нормально было! Короче, «на колу мочало, начинай сказку по анализу сайта сначала». И вот тут самое интересное: в процессе разборки страницы я нашёл, что на ней присутствует ещё и текст стрипа! Слегка прикопан, но вполне различим и выделяем! Но ко всем ли стрипам он есть? Я открыл самый первый стрип. Текст есть. Открыл случайный стрип за 80-й год. Есть. Я потёр руки и занёс их над клавиатурой...

Через несколько часов свежеиспеченый скрипт выудил текст от самого последнего на тот момент стрипа, а еще через двадцать минут под каждым стрипом на сайте архива появился текст оригинала. «Не было бы счастья, да несчастье помогло», как говорится!

КОММЕНТИРОВАТЬ - ПО ЭТОЙ ССЫЛКЕ

Еще пара записей из блога, навскидку:
Мультяшное солнце. (рубрики: обои)
Жидкий вакуум (рубрики: это я так шучу)
Футболок не будет (рубрики: футболки)



 


Самый-самый блог
Блогер Рыбалка
Рыбалка
по среднему баллу (5.00) в категории «Спорт»


Загрузка...Загрузка...
BlogRider.ru не имеет отношения к публикуемым в записях блогов материалам. Все записи
взяты из открытых общедоступных источников и являются собственностью их авторов.