技术观点

加强技术投入,共享技术成果

如何评价一个网站的人气


编辑:杭州大显网络科技有限公司更新日期:2009-05-26
Google等新搜索引擎结果最成功的地方在于利用PageRank对网页进行排序,总是让好的结果排在前面,从而大大提高了搜索的质量。简单的说:PageRank类似于科技文献的引用制度,谁的页面被引用次数多,而且引用你页面的站点权威度高,就说明你的页面的质量高,人气旺,PageRank就高。所以,这就是为什么同样是包含"MP3"这个关键词的页面,为什么MP3.COM排在前,而一些个人网站的MP3下载排在后面。
对于网站人气比较通用的说法是:LINKPOPULARITY即:站点流行度。对于站点推广服务来说站点的人气评定已经是一个非常普遍的指标,很多搜索引擎的高级搜索功能中都包含反向链接搜索功能:列出链接到某个网页地址的所有其他网页,因此反向链接的多少也可以作为站点人气评定的一个客观指标。有专门的站点推广服务商帮助你直接从多家搜索引擎抓取类似的结果。

在Google上查LINKPOPULARITY,头2条会找到2家比较著名的站点人气评定的网站:LinkPopularity.com和LinkPopularityCheck.com。

我比较了一下LinkPopularity.com和LinkPopularityCheck.com的结果。linkpopularity.com的搜索结果不佳,而且它用的是Google的结果,后面会说到,这是一个错误的方法。LinkPopularityCheck.com结果好一些。它们的原理都是利用一些比较大的搜索引擎的LINKTO:命令功能实现的:统计连接到指定网页的链接数。链接数越高,人气(popularity)就越高。

数据源结果
LinkPopularityALTAVISTA,HOTBOT
Google结果一般,但Google的结果不应该作为指标

LinkPopularityCheckALTAVISTA,HOTBOT,MSN,LYCOS结果比较多,而且有很好的界面,结果按照查得的LINK多少排序,并用柱型图表示。
但他们msn的接口有问题,对于子页面的统计有问题,比如:http://news.163.com/viewpoint.html,结果是0但实际上应该有145条。

当然网上还有很多类似的资源甚至源程序,这里就不一一介绍了。但是这些的数据是否客观呢:随着互联网的商业化和分工细化,大部分网站的搜索结果其实是少数几个大的搜索引擎技术提供商提供的,比如:Google,INKTOMI,fast等(去这些门户网站的页面检索上看看上面的POWEREDBY就知道了),例如:YAHOO的后台网页搜索引擎是Google,LYCOS的后台是FAST搜索引擎,而上面MSN和HOTBOT的搜索结果其实都是INKTOMI提供的,之所以不同网站的结果数量略有出入,只是由于服务条款的限制而已。所以,如果能够尽量使用后台的服务提供商的搜索结果,数字应该是比较全的。

其次,有些结果并非反向引用,我按照以下规则试验了以上搜索引擎的接口:

能区别域名:www.yeah.net>chedong.yeah.net,这样很多个人站点的域名转向就能和www.126.com,www.yeah.net区别开了
能区别子目录:能够区别一个站点的首页和其子页面,比如:http://news.163.com/和http://news.163.com/viewpoint.html子栏目
能够区别大的站点:www.yahoo.com>www.sina.com.cn>www.chedong.com
具体的命令接口参考了MeasuringLinkPopularity专题中对各个搜索引擎一些隐含的命令的介绍,最后我选择用做站点人气评价的搜索引擎包括:AltaVista,Msn(inktomi),AlltheWebNorthernLight这4个比较大的引擎:(没有选用Google,因为它的link:命令其实是针对域名的,比如:查www.yeah.net和chedong.yeah.net的结果数是一样)

命令例子
AltaVistalink:URL命令
MSN(Inktomi)点选高级搜索》在下面的下拉框里选择LINKTOURL=》填写URL
AlltheWeblink.all:URL
注意这里URL需要去掉HTTP://http://alltheweb.com/search?cat=web&lang=any&query=link.all:chedong.yeah.net
NorthernLightlink:urlhttp://www.northernlight.com/nlquery.fcg?qr=link:http://www.yeah.net/