找回一个消失的网页

方法 1:网页快照
网页快照,是搜索引擎在收录网页时,对该网页进行索引,然后存入服务器缓存里,网页快照因此也只能显示网页的最新收录结果。大多数搜索引擎都会显示”网页快照“的选项,但在网站 https://2tool.top 上,输入网页地址可以同时查看多个搜索引擎的网站快照。

方法 2:Internet Archive
Internet Archive 是一个成立于 1996 年的非营利性的数字图书馆组织,以保护数字文化遗产为使命,它会定期收录并永久保存全球的网页,就像收藏旧报纸一样收藏旧网页,直到2012年10月,其信息储量已经达到了 10PB。
使用方法很简单,只需要将网页地址输入,查询即可。右上角的黑色柱状条表明了存档的年份和数量的多少,页面中间的圆圈则表示网页存档量的多少。通过查询我们就可以知道某个网页的变化史。

Internet Archive 是爬虫自动收录,不同的网站,其收录的数量和周期也不一样,大网站可能每天都会收录一次,小网站也可能会一年才收录一次,一些重要的网页,可以手动提交保存。
方法是在 https://web.archive.org/save/ 后面加入要保存的网页地址即可。比如 https://web.archive.org/save/https://www.runningcheese.com,也可以使用拓展或者小书签来一键保存。

方法 3:Archive Today
由于 Internet Archive 是爬虫收录,且遵循 Robots 协议,如果网站已经声明不允许收录某个网页、目录、甚至是全站,那么将不会收录。
Archive Today 是一个类似于 Internet Archive 的网站,由私人资助,采取的是主动存档策略,可以保存任意一个网页,保存速度快,而且还提供了网页打包下载。Archive Today 可以说是对 Internet Archive 的补充。

评论

此博客中的热门博文

怎么用人民币买数字货币

友金所注册送8888元体验金

Gas 价格预测工具