功能测试
深圳SEO悦鹜博客首页 > SEO > 正文

百度分词原理的探讨与猜测

发布-YUEWU.ORG | 查看- | 发表时间-2012/6/5

百度搜索引擎是名副其实的中文搜索老大哥,严格来说是他有了一套非常好的分词技术。当然高深的分词技术我们是无法探知的。但是通过一些表面现象,也能管中窥豹,初步猜测百度的分词原理。今天深圳SEO悦鹜就谈一谈关于百度分词的一点点基本的猜测。

首先我们要了解百度分词的条件,并不是所有的词都会有分词产生,例如我们搜索“研究生”,返回的结果,我们会看到精准匹配,那么百度就对这个词没有进行了分词处理,图:

分词

而我们搜索“小说下载”,百度就会将这些词拆分为“小说”“下载”“小说下载”,如图:

小说

于是有朋友就在猜测会不会百度以三个中文字为限,开始实施分词呢?大家可以多次测试一下,这种说法是相当有市场的,但是后面悦鹜又搜索关键词的时候发现一个问题,如果一个词已经被百度词库收为一个单独的词,那么不管他多么长,百度也会先推荐精准匹配网页,然后推荐分词匹配网页。

例如,在搜索“你妈妈喊你回家吃饭”,一般来说这样的句子肯定是要被分词处理的,但是因为去年一贴走红网络,这个句子已经成为大家常的词语,百度也已经对这个词比较认可了,将他收入词库中,那么它就可以实现精准匹配。如下图,网页标题中都是精准匹配,未见分词匹配:

悦鹜SEO

通过以上几种搜索结果猜测:用户搜索某个关键词,百度会根据自己词库先进行精准匹配,如果这个词是很常用的词,那么百度就会调用相关的网页结果,如果不存在就进行分词处理,得出的搜索结果也会产生一些分词处理情况,至于结果排名影响因素比较多,比如网站的权重、网站是否把这个词做为长尾关键词目标关键词来做重点优化等。具体的需要深入分析,这里就不班门弄斧了。

更多

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

华强北手机报价 多一个词就多分一个权重
http://www.68eg.com/ 2012/6/10 18:58:58 【回复】
鸡排加盟 百度分词技术做了,可以做多个关键词。
最新文章
最近评论
访客留言
版权所有 Copyright(C)2011-2017 悦鹜博客 | 深圳SEO | 网站优化 | SEO入门笔记