近一个客户的网站,因受到了企鹅算法影响,流量有所下滑,我们提交了Google重审,重审后回复邮件:

We received a request from a site owner to reconsider http://www.xxxxxxxxxx.com/ for compliance with Google’s Webmaster Guidelines.

We reviewed your site and found no manual actions by the webspam team that might affect your site’s ranking in Google. There’s no need to file a reconsideration request for your site, because any ranking issues you may be experiencing are not related to a manual action taken by the webspam team.

我们审查了您的网站,并没有发些任何垃圾网站团队(黑帽SEO)对您进行可能影响您网站在谷歌排名的痕迹。所以您没有必要为您的网站提交复议请求,因为任何您可能遇到的网站排名问题都与垃圾网站团队(黑帽SEO)的操作无关。

—————————————–

这里我们看到了 webspam team,Web Spam Detection (网路垃圾侦测) 是搜寻引擎极力研究的重点方向,透过网路垃圾侦测,可以提供Google有用的垃圾产生者资讯,并且当成演算法修正的依据,我们来看看网路垃圾侦测的相关技术…

网路垃圾通常可以分成三大类型(如下图): Link based techniques (连结类型)、Content based techniques (内容类型)、Hiding techniques (隐藏类型)。



(资料来源: A SURVEY ON WEB SPAM DETECTION METHODS: TAXONOMY By S Ghiam)

但是虽然说这些网路垃圾使用的是techniques(技术),其实是有些过度描述了,因为大多都使用很基本的网页设计方法,并不需要太高深的技 术。因此,要抓出上述的三种网路垃圾,对Google来说,并不是一件难事,问题是网路垃圾太多,所以Google也只能以排序的方式来处理。

将上述的网路垃圾说明如下:

(1) Link based techniques (连结类型) 就是制造假连结,透过锚点文字传递意含,透过Pagerank传递信任度。这类连结在我们的研究中发现,只要spider由黑帽SEO本身网站搜寻起,就 可以找到一大串制造垃圾的站群,这些站群都是互相串连,并且再外连到操作的客户网站上。通常企业网站都不会知道,他们的网路排名是透过垃圾站群的操作,当 垃圾站群被Google处理之后,当然企业网站就会连带遭受池渔之殃。

(2) Content based techniques (内容类型) 就是制造假内容,所谓假内容就是专门为了搜寻引擎而制造的内容。这类内容又分两种,第一种是无意义的内容,第二种是有意义但是抄袭或是重复的内容。这两种 方式也都很容易侦测。前者只需要由使用者行为模式分析即可得到,根本不需要去看内容。后者则可以由词汇等等分析,找到抄袭或是重复的来源。并且这类作假都 会结合连结类型作假,因此也可以使用上述方法辅助侦测。

(3) Hiding techniques (隐藏类型) 就是把想要喂给搜寻引擎的资料,以隐藏的方式存在,使用者并不会看到,或是不容易看到,例如安排在同色系的网页中。隐藏的资料类型也可分为内容或是连结, 内容则是想锁定的关键字,连结则是连往操作的对象。这类型的侦测,可以由网页原始码,或是辅以上述两种方式得到结果。

所以,Google是否能够侦测黑帽SEO? 当然是没有问题的。我们后续再来介绍相关的演算法以及实际例子。如果您有任何宝贵意见,欢迎讨论啰。