Web page history

Posted by Anton Katunin on 30 May 2009
Tags: russian

Думаю такое уже существует, хотя никогда с этим не встречался.

В связи с массивным ростом интернета и информации в нем, то вполне актуально иметь историю интернета, а т.е. его страниц. Речь идет о выборочных страницах, а не всей сети. Это можно делать как в автоматическом режиме бота, так и в пользовательском.

Автоматический.
Бот периодически проверяет новую информацию на заданом сайте, и если есть какие нибудь изменения, то сохраняет их.

Пользовательский.
Сайт проверяется каждый раз когда пользовать открывает его.

Фишки:

  • В любом случае, имея историю, можно смотреть что было добавлено с момента последнего посещения и выделять это при просмотре.
  • Наиболее интересная функция это "эволюция страницы". Основываясь на истории, можно посмотреть как она изменялась со временем.
  • История страниц наиболее интересна для главных страниц сайтов. Т.к. они изменяются чаще всего и как правило старицы контента более менее остаются такими же.

    Реализация.
    Самое первое что приходит в голову, это использование уже готовые механизмы репозитори. Большая часть функций в них уже сделана. Тем не менее, прийдется подтачивать под наши нужды, и специфику страниц, а это динамический контент и реклама.


    Read next:

    Program chess testing