找回一个消失的网页
方法 1:网页快照 网页快照,是搜索引擎在收录网页时,对该网页进行索引,然后存入服务器缓存里,网页快照因此也只能显示网页的最新收录结果。大多数搜索引擎都会显示”网页快照“的选项,但在网站 https://2tool.top 上,输入网页地址可以同时查看多个搜索引擎的网站快照。 方法 2:Internet Archive Internet Archive 是一个成立于 1996 年的非营利性的数字图书馆组织,以保护数字文化遗产为使命,它会定期收录并永久保存全球的网页,就像收藏旧报纸一样收藏旧网页,直到2012年10月,其信息储量已经达到了 10PB。 使用方法很简单,只需要将网页地址输入,查询即可。右上角的黑色柱状条表明了存档的年份和数量的多少,页面中间的圆圈则表示网页存档量的多少。通过查询我们就可以知道某个网页的变化史。 Internet Archive 是爬虫自动收录,不同的网站,其收录的数量和周期也不一样,大网站可能每天都会收录一次,小网站也可能会一年才收录一次,一些重要的网页,可以手动提交保存。 方法是在 https://web.archive.org/save/ 后面加入要保存的网页地址即可。比如 https://web.archive.org/save/https://www.runningcheese.com,也可以使用拓展或者 小书签 来一键保存。 方法 3:Archive Today 由于 Internet Archive 是爬虫收录,且遵循 Robots 协议,如果网站已经声明不允许收录某个网页、目录、甚至是全站,那么将不会收录。 Archive Today 是一个类似于 Internet Archive 的网站,由私人资助,采取的是主动存档策略,可以保存任意一个网页,保存速度快,而且还提供了网页打包下载。 Archive Today 可以说是对 Internet Archive 的补充。