Парсер файлов

Парсер файлов

Парсер файлов – вещь незаменимая во многих областях интернет маркетинга да и не только. Существует огромное количество файловых форматов, которые используются в тех или иных задачах.

Сразу приведем простой пример задачи, для которой мы недавно делали парсер файлов. Задача: собрать объявления по продаже квартир из обычной газеты и сохранить только объявления от собственников. Для начала газета сканируется и результаты сканирования распознаются с помощью FineReader, который сохраняет их в TXT файлы. На следующем этапе созданные ранее TXT файлы подаются на вход парсеру файлов. Далее парсер разбивает текст на предполагаемые блоки с объявлениями, в каждом объявлении распознает его параметры (комнатность, этажность, цену, телефон и т.д.). Затем распознанный телефон сравнивается с телефонами в базе данных посредников и если он там отсутствует, то объявление сохраняется.

Выше приведен довольно тривиальный вариант работы парсера файлов, однако стоит заметить, что он более чем востребован и позволяет значительно повысить эффективность бизнеса агентов по недвижимости (это мы цитируем “feedback” наших покупателей).

Вообще парсера файлов встречаются везде и повсюду. Они могут быть представлены как в виде отдельного программного комплекса, так и в виде одного из модулей программы.

Парсер логов

Парсер логов – один из самых распространенных видов парсера файлов. Многие программные продукты сохраняют свои логи в файл. Зачастую чтобы проанализировать лог многодневной работы программы и найти там интересующую информацию – уходит довольно много времени. Решением здесь является – создать парсер логов, который может в считанные секунды проанализировать огромный файл лога и сохранить именно те данные, которые необходимы для анализа (например с целью поиска условий, в который приложение сбоит).

Парсер txt, csv, xml и т.п.

И конечно же, не стоит забывать о парсерах распространенных форматов файлов. Например, парсер csv очень часто используется вебмастерами интернет магазинов. Парсер XML файлов – это обычная вещь в арсенале любого программиста. Что касается людей, часто экспериментирующих с манипуляцией выдачей поисковиков, то они зачастую используют универальный парсер TXT.

Парсер прайсов

Думаю, не стоит пояснять чем удобен парсер прайсов. Ясно, что этот программный компонент дает возможность в считанные секунды найти самые выгодные предложения, пришедший от ваших поставщиков.

Если вам понадобился парсер файлов, то мы можем обсудить его создание прямо сейчас.

One comment

Leave a Reply

Go to Top