Парсер файлов

Парсер файлов

Парсер файлов – вещь незаменимая во многих областях интернет маркетинга да и не только. Существует огромное количество файловых форматов, которые используются в тех или иных задачах.

Сразу приведем простой пример задачи, для которой мы недавно делали парсер файлов. Задача: собрать объявления по продаже квартир из обычной газеты и сохранить только объявления от собственников. Для начала газета сканируется и результаты сканирования распознаются с помощью FineReader, который сохраняет их в TXT файлы. На следующем этапе созданные ранее TXT файлы подаются на вход парсеру файлов. Далее парсер разбивает текст на предполагаемые блоки с объявлениями, в каждом объявлении распознает его параметры (комнатность, этажность, цену, телефон и т.д.). Затем распознанный телефон сравнивается с телефонами в базе данных посредников и если он там отсутствует, то объявление сохраняется.

Выше приведен довольно тривиальный вариант работы парсера файлов, однако стоит заметить, что он более чем востребован и позволяет значительно повысить эффективность бизнеса агентов по недвижимости (это мы цитируем “feedback” наших покупателей).

Вообще парсера файлов встречаются везде и повсюду. Они могут быть представлены как в виде отдельного программного комплекса, так и в виде одного из модулей программы.

Парсер логов

Парсер логов – один из самых распространенных видов парсера файлов. Многие программные продукты сохраняют свои логи в файл. Зачастую чтобы проанализировать лог многодневной работы программы и найти там интересующую информацию – уходит довольно много времени. Решением здесь является – создать парсер логов, который может в считанные секунды проанализировать огромный файл лога и сохранить именно те данные, которые необходимы для анализа (например с целью поиска условий, в который приложение сбоит).

Парсер txt, csv, xml и т.п.

И конечно же, не стоит забывать о парсерах распространенных форматов файлов. Например, парсер csv очень часто используется вебмастерами интернет магазинов. Парсер XML файлов – это обычная вещь в арсенале любого программиста. Что касается людей, часто экспериментирующих с манипуляцией выдачей поисковиков, то они зачастую используют универальный парсер TXT.

Парсер прайсов

Думаю, не стоит пояснять чем удобен парсер прайсов. Ясно, что этот программный компонент дает возможность в считанные секунды найти самые выгодные предложения, пришедший от ваших поставщиков.

Если вам понадобился парсер файлов, то мы можем обсудить его создание прямо сейчас.

No comments yet.

You must be logged in to post a comment.