对于目前国内整体搜索引擎来说,百度可谓是国内搜索引擎的领军者,笔者将为百度搜索引擎带来的HITES公开文件为多种角度和实验,深入分析HITS在搜索引擎优化中的实际作战应用。
首先,让我们了解什么是hits算法,包括它的计算公式和算法原理以及它的优缺点。在深入理解了这些意义之后,我们使用了一些具体的实验来验证HITS的效果和实用性。
一、什么是Authority页面(权威页面)
简言之,授权页面是指某一领域或相关主题的高质量页面。例如,在招聘领域,51招聘网站的主页是这一领域的高质量和高质量的网页。例如,淘宝主页是电子商务领域的一个高质量网页。
二、什么是Hub页面(枢纽页面)
而集线器页面(集线器页面)通常是它的页面本身包含了很多高质量的权威页面链接,比如360 URL导航主页是一个非常好的集线器页面(Hub页面)。因为360网站导航的网站页面中有很多不同类型的权威网站集,比如新浪、腾讯等权威网站的新闻栏目。视频部分收集搜狐视频、优酷视频和其他权威网站。这一点与你经常发布的一些分类目录网站链有点相似(所以为什么网站目录链会有一定的效果,是因为搜索引擎本身有自己独特的算法,会影响你的排名)。
HITS算法之所以存在,是因为搜索引擎需要在用户抓取的Web文档集合中找到查询词的最高匹配度,而这里的最高匹配度与一些高质量的“权威”页面和“集线器”页面有关,而不是每个人都能理解的站点中高质量的原始文章等因素。特别是一些权威页面,搜索引擎更亲持久,因为这样的网站页面内容会更满足用户的查询内容。
一般来说,搜索引擎中有很多算法,包括HITS算法、HillTop算法、SALSA算法、PageRank算法等等,在比如还有文档检索模型(包含向量空间模型、概率模型、布尔模型等),在比如还有倒排索引、TF-IDF等。事实上,这些百度算法可以找到相应的透明计算公式,如果能对其进行研究和深入研究,不难发现一些SEO排名的奥秘所在。