您的位置 AB分类目录 > 百科资讯 >

搜索引擎排名过程简述与搜索引擎的基本架构

导读:搜索引擎排名到底是如何完成的呢?经过了搜索引擎蜘蛛爬行与抓取,以及索引处理之后,就到了用户搜索,搜索引擎排名的阶段了。今天,SEOBOOK带来的是《搜索引擎的基本架构与搜索…

搜索引擎排名到底是如何完成的呢?经过了搜索引擎蜘蛛爬行与抓取,以及索引处理之后,就到了用户搜索,搜索引擎排名的阶段了。今天,SEOBOOK带来的是《搜索引擎的基本架构与搜索引擎排名过程简述》。希望对大家有所帮助。

搜索引擎排名

一、搜索引擎排名过程简述

1、用户搜索词处理

① 中文分词

将短句转换为词形式。与索引处理时做法相同。

② 去停止词

将无用效果词全部去掉,与索引处理时做法相同。

③ 指令与逻辑处理

一般,分词之后,会将分词的两种形式以且的逻辑处理。

如搜索“seo小小课堂”,会查找既包含“seo”,又包含“小小课堂”的结果。

但在高级指令中,可能会有所不同,比如“-”减号,代表着不包含后面的。

如搜索“搜索引擎优化 –优化”,则指会呈现出“搜索引擎”的相关结果。

搜索引擎优化 –优化

④ 明显拼写错误纠正

例如搜索“博人转”,则会校正为“博人传”。

明显拼写错误纠正-博人转

⑤ 下拉词

当我们搜索词,输入框中会自动显示一些其他人搜索的相关的长尾词。

例如搜索“小小课堂”,输入框则会出现“seo小小课堂”的字样。

下拉词示例-小小课堂

⑥ 整合搜索

整合搜索,可能是出来的资讯,也可能出来的是视频。

例如在手机百度上搜索“seo小小课堂”,第一个搜索结果是百度的聚合视频。

整合搜索-视频示例

例如搜索一个热门新闻,则会出现资讯。

整合搜索-资讯示例

2、文件匹配

处理搜索词之后,搜索引擎得到了用户的几个词,然后去寻找包含这些词的所有文件。

然后找到同时包含这几个词的文件,然后开始进行排序。但也会有一种情况就是可能只包含其中某些词,依然有很好的排名。

关键词1:文件1,文件5,文件19…

关键词2:文件3,文件5,文件28…

如果用户搜索词同时包含了“关键词1”和“关键词2”,参与排名的就是文件5。

3、子集选择

对文件的范围进行限定,例如对一万个页面进行排序。

4、相关性计算

页面与关键词的相关性可以从下面几个方面来考虑,仅仅是简单介绍哦:

① 关键词频率和密度

关键词出现的频率和密度是比较重要的,但是千万不要做关键词堆砌。

② 关键词位置与表现形式

关键词一般在首位等位置出现,表现形式以标签形式、链接形式、加粗等用来做强调。

③ 关键词是否完美匹配

关键词完整出现也是影响相关性的因素之一,如出现“搜索引擎优化”和出现“搜索引擎中的各种优化问题”是不同的效果。而且这两个词之间的离的越远效果越差。

④ 网站权重与页面权重

整站的权重与页面的权重对排名有着非常大的影响。

⑤ 链接投票

页面有多少从外部来的链接投票,影响着关键词的排名。当然,高权重且有相关性的网站才是最有效的。

⑥ 关键词的常用程度

例如,“seo优化”,其实“优化”很容易出现,但“seo”单指seo行业,假如分词技术将其分成两个词,那么“seo”必然是比较重要的那一个,而“优化”作用要小的多。

5、排名过滤与调整

通过以上相关性的计算,基本的排名已经确定,但是还需要进行一些微调,例如作弊嫌疑的页面过滤,权重高和相关性强的网站排名靠前。

6、排名展示

排名确定之后,搜索引擎会将页面的标题标签、描述标签等调用并显示,但如果用户搜索词并不在描述标签内,搜索引擎可能会将文章中提到搜索词的地方提取出来作为页面摘要。

7、搜索缓存

大部分人搜索词几乎是一样的,所以,搜索引擎会将最常见的搜索词和结果存入缓存,当用户搜索时可直接调用,提升排名效率,缩短了搜索结果出现的时间。

8、用户查询及点击日志

搜索用户的一些数据都是可以被搜索引擎记录的,作为了影响排名的数据。例如:用户的IP地址、查询词、点击了哪些页面、反复搜索了几次等等。

二、搜索引擎的基本架构

作为一名优秀的搜索引擎优化师,应该了解搜索引擎的工作原理,比如基本的架构。

1、什么是搜索引擎的架构?

搜索引擎架构可以当作软件架构来理解。

① 软件架构

百度百科对于软件架构的描述如下:

软件架构,是指一系列相关的抽象模式,用于指导大型软件系统各个方面的设计。

② 搜索引擎架构

那么搜索引擎的架构,就是用于指导搜索引擎系统中重要的组件以及组件之间关系而设计的抽象模式。

2、设计搜索引擎架构的目标是什么?

搜索引擎优化师应该知道为什么要设计搜索引擎架构,主要有以下两点:

① 搜索效果

搜索引擎致力于优化用户搜索体验,当用户搜索某个词之后,可以给予用户更多更精准的结果。这就是在质量层面上的目标。

② 搜索效率

搜索引擎追求更快地展现出用户查询词的搜索结果,也是为了提升用户搜索体验,试想如果我们搜索一个词,搜索引擎一分钟后才显示出结果,这样的搜索引擎在这个时代是要被淘汰的。这就是在速度层面上的目标。

小结:因为用户需要一个高效的搜索引擎系统,对搜索引擎有效果和效率的要求,所以,结构的目标也就是这两点了。

3、搜索引擎的基本架构是什么?

对于搜索引擎优化师而言,只需要在抽象模式上了解搜索引擎架构即可,也无需关注过多的数学公式与算法。

搜索引擎基本架构主要有索引处理和查询处理。

① 索引处理

索引过程主要由以下几个组件来完成:

1)文本采集组件

文本采集组件,主要用于发现、存储和传递文档。

2)文本转换组件

文本转换组件,主要用于提取文档中所有内容和元数据,同时将文本转换为索引项。

元数据可以理解为页面的基本参数,如类型、结构、多少字等等。

索引项,又可以称之为特征,是对文档内容的一部分,符合要求的文档的索引会被存放在索引表中用于搜索。

3)索引创建组件

索引创建组件,利用文本转换组件输出的文档和索引项,创建索引表,从而实现快速搜索。

索引的创建非常重要,尤其是针对互联网的信息爆炸时代,对于新的文档加入时,应高效完成索引创建。为了实现高效,一般都采用的倒排索引。

② 查询处理

查询处理主要由以下几个组件来完成:

1)用户交互组件

用户交互组件,提供了用户查询和搜索引擎展现搜索结果之间的接口。

搜索引擎接收到用户的查询词后,在索引库中找到相关文档,按照程序认为的最合理的索引排序结果展现给用户。

2)排序组件

排序组件,从用户交互组件中获得查询词,并且根据一定的模型给出一个得分从高到低排序的文档。

排序的高效依赖于搜索引擎检索技术的高低,排序的质量取决于搜索引擎的检索模式。

3)评价组件

评价组件,主要用于评测和评价搜索引擎系统的效果和效率的目标。

一来可以统计大量搜索日志来记录和分析用户行为,二来评价的结果用来调整和改善排序组件的性能,从而提升用户的搜索体验度。

以上就是SEOBOOK带来的《搜索引擎的基本架构与搜索引擎排名过程简述》。感谢您的观看。

AB分类目录部分内容来源于互联网,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,如有侵犯版权请来信告知QQ:2216876660,我们将立即处理。

为您推荐