Web page history

Posted by Anton Katunin on 30 May 2009
Tags: russian

Думаю такое уже существует, хотя никогда с этим не встречался.

В связи с массивным ростом интернета и информации в нем, то вполне актуально иметь историю интернета, а т.е. его страниц. Речь идет о выборочных страницах, а не всей сети. Это можно делать как в автоматическом режиме бота, так и в пользовательском.

Автоматический.
Бот периодически проверяет новую информацию на заданом сайте, и если есть какие нибудь изменения, то сохраняет их.

Пользовательский.
Сайт проверяется каждый раз когда пользовать открывает его.

Фишки:

  1. В любом случае, имея историю, можно смотреть что было добавлено с момента последнего посещения и выделять это при просмотре.
  2. Наиболее интересная функция это "эволюция страницы". Основываясь на истории, можно посмотреть как она изменялась со временем.

История страниц наиболее интересна для главных страниц сайтов. Т.к. они изменяются чаще всего и как правило старицы контента более менее остаются такими же.

Реализация.
Самое первое что приходит в голову, это использование уже готовые механизмы репозитори. Большая часть функций в них уже сделана. Тем не менее, прийдется подтачивать под наши нужды, и специфику страниц, а это динамический контент и реклама.


Read next:

Program chess testing