Наполнение интернет магазина
2011-10-17 17:16:01
Кто в своей жизни ни разу не наполнял интернет магазин товарами самостоятельно ...
+ развернуть текст сохранённая копия
Кто в своей жизни ни разу не наполнял интернет магазин товарами самостоятельно, тому крупно повезло. Он не знает что такое 124-я позиция товара дрожащими руками добавленная в витрину после 7-й бессонной ночи и 93-й чашки кофе...
Расскажу немного о своем опыте. Так уж получилось, что у меня появился почти пустой интернет-магазин с доменом в зоне [...]
Тэги:
catalogloader,
парсер,
товар
Наполнение интернет магазина
2011-10-17 17:16:01
Кто в своей жизни ни разу не наполнял интернет магазин товарами самостоятельно, ...
+ развернуть текст сохранённая копия
Кто в своей жизни ни разу не наполнял интернет магазин товарами самостоятельно, тому крупно повезло. Он не знает что такое 124-я позиция товара дрожащими руками добавленная в витрину после 7-й бессонной ночи и 93-й чашки кофе...
Расскажу немного о своем опыте. Так уж получилось, что у меня появился почти пустой (не наполненный товарами) интернет-магазин с [...]
Тэги:
catalogloader,
парсер,
товар
Ответы@Mail.Ru – мечта спамера
2011-09-28 15:14:30
С удивлением заметил, что e-mail адреса пользователей сервиса “ответы” на mail.ru ...
+ развернуть текст сохранённая копия
С удивлением заметил, что e-mail адреса пользователей сервиса “ответы” на mail.ru хранятся в коде страниц в открытом виде, как на заре интернетов прямо. Никаких попыток скрыть адреса – даже странно в наше время. Можно легко и непринуждённо сграбить базу email для дальнейшего брутфорса паролей к ним или например спама (поскольку на сервисе есть категории – [...]
Тэги:
mail.ru,
интернет,
новость,
парсер
Python / Grab — python библиотека для парсинга сайтов
2011-09-02 14:37:10
Лет пять-шесть назад, когда я ещё программировал преимущественно на PHP, я начал использовать ...
+ развернуть текст сохранённая копия
Лет пять-шесть назад, когда я ещё программировал преимущественно на PHP, я начал использовать библиотеку curl для парсинга сайтов. Мне нужен был инструмент, который позволял эмулировать сессию пользователя на сайте, отсылать заголовки обычного браузера, давать удобный способ отсылки POST-запросов. Сначала я пытался использовать напрямую curl-расширение, но его интерфейс оказался очень неудобным и я написал обёртку с более простым интерфейсом. Время шло, я пересел на python и столкнулся с таким же дубовым API curl-расширения. Пришлось переписать обёртку на python.
Читать дальше →
Тэги:
curl,
grab,
lxml,
pars,
pycurl,
python,
scraping,
xpath,
грабинг,
парсер,
парсинг
*nix / [Из песочницы] Парсер на shell с обходом XOR-шифрования при авторизации
2011-08-31 21:18:46
... возникла необходимость в
парсере интернет-счета банковской ...
+ развернуть текст сохранённая копия
Недавно возникла необходимость в парсере интернет-счета банковской карты для дальнейшего уведомления об операциях посредством смс\e-mail. Сделать это было решено по-быстрому шел-скриптом, который будет парсить страницу со счетом с определенной периодичностью при помощи задания в cron, а в случае изменения баланса счета — высылать сообщение на мобильный телефон или e-mail. Ничего сложного на первый взгляд, однако в ходе написания пришлось решить некоторые сложности, о которых вы сможете прочесть под катом.
Читать дальше →
Тэги:
bash,
pars,
parser,
shell,
unix,
xor-шифрование,
анализ,
парсер,
парсинг,
синтаксический
Страницы:
1 2 3 4 5 6 7 8 9 10 11 12