如何删除索引之Google索引中不需要内容的删除

如何删除索引之Google索引中不需要内容的删除

您通常希望Google为尽可能多的索引网站。但是,有些时候您发现您不小心让Google索引了您不想发布的机密内容或其他信息,并且希望尽快将其删除。

从谷歌索引库中移除内容和从搜索结果中移除内容,是两个不同的概念;从索引库中移除的内容是肯定不会展示在搜索结果中,但从搜索结果中移除的内容,可能还是会存在索引库中的,这会影响到我们对网站索引量的有效统计。

可以通过以下3种途径进行处理一处Google索引中不需要的内容:

 (1) 元标记

可以在页面<head>代码中添加 <meta name=”robots” content=”noindex,follow”> 防止页面被编入索引

 (2) 404、410标记

404——没有发现文件、查询或URL

当蜘蛛爬取到404/410错误链接时,会在网站日志和管理员工具中的抓取错误部分体现出来,这时你便可以通过删除网址工具予以删除,且那些删除的内容也不会被编入索引。

   (3) 使用robots.txt文件删除google中的索引

首先你在你的robots.txt中加上你要删除的网页(目录);然后再在管理工具中提交一下!

例如:我不希望abc.html 和 001.html 存在于Google的索引中! 那么我们的robots.txt要这样写!

User-Agent: *
Disallow: /abc.html
Disallow: /001.html
Allow: /