Думаю такое уже существует, хотя никогда с этим не встречался.
В связи с массивным ростом интернета и информации в нем, то вполне актуально иметь историю интернета, а т.е. его страниц. Речь идет о выборочных страницах, а не всей сети. Это можно делать как в автоматическом режиме бота, так и в пользовательском.
Автоматический.
Бот периодически проверяет новую информацию на заданом сайте, и если есть какие нибудь изменения, то сохраняет их.
Пользовательский.
Сайт проверяется каждый раз когда пользовать открывает его.
Фишки:
- В любом случае, имея историю, можно смотреть что было добавлено с момента последнего посещения и выделять это при просмотре.
- Наиболее интересная функция это "эволюция страницы". Основываясь на истории, можно посмотреть как она изменялась со временем.
История страниц наиболее интересна для главных страниц сайтов. Т.к. они изменяются чаще всего и как правило старицы контента более менее остаются такими же.
Реализация.
Самое первое что приходит в голову, это использование уже готовые механизмы репозитори. Большая часть функций в них уже сделана. Тем не менее, прийдется подтачивать под наши нужды, и специфику страниц, а это динамический контент и реклама.