
Наш клиент — компания-поставщик оборудования для сканирования документов в Москве, Московской области и по всей России. Сайт заказчика работает на самописной системе управления.
Спарсить 2 категории товаров с сайта поставщика оборудования для сканирования документов.
Парсинг не всегда заимствование или воровсто. Парсинг может быть с дружественного партнерского сайта, когда нет иной возможности получить нужную информацию.
Парсинг товаров — это автоматический процесс сбора информации о товарах с интернет-магазинов и других торговых площадок с помощью специальных программ-парсеров или небольшого скрипта под конкретную задачу.
Процесс парсинга товаров включает несколько этапов:
Для данного клиента мы уже выполнили работу по доработке каталога оборудования для сканирования документов (парсинг xml-фида от одного из поставщиков, настройка дополнительных полей для возможности настройки фильтров), настройка фильтров в категориях товаров.
Следующей задачей был парсинг 2-х категорий товаров по реставрационному оборудованию. Фид от поставщика мы получить не смогли, поэтому по просьбе клиента нами был написан скрипт парсера, который проходит определенные категории, забирает подразделы выбранных категорий и товары со всеми ключевыми параметрами и фотографиями.
Далее скрипт собирает структуру с товарами во временную таблицу, из которой в дальнейшем клиент самостоятельно распределил товары по структуре своего сайта. Было импортировано порядка 3 200 товаров.
Время работ на момент подготовки поста — 4 часа: написание скрипта парсинга, тестирование, парсинг из 2-х выбранных клиентом категорий товаров порядка 3 200 товаров.