繁體
|
簡體
Sclub交友聊天~加入聊天室當版主
(檢舉)
分享
新浪微博
QQ空间
人人网
腾讯微博
Facebook
Google+
Plurk
Twitter
Line
標題:
[建站經驗]
学习搜索引擎的分词技术
[打印本頁]
作者:
superman1024
時間:
2013-9-25 11:40
標題:
学习搜索引擎的分词技术
简单的将搜索引擎的分词技术分为两类:
第一类是基于字符串匹配的分词方法,主要有正向最大匹配、逆向最大匹配、最少切分等方式。简单的举个例子,我们是中华人民共和国的公民,在这句话中包含的词有我们,是,中华,人民,共和国,的,公民,一共是7个词。但是为了实现最大匹配我们还知道中华人民共和国是一个整体,于是上面的这句话就可以分为我们/是/中华人民共和国/的/公民,一共是5个词。这样搜索引擎就会自动匹配并选择第二种分词结果,为了提高搜索引擎的速度,搜索引擎都是会设置一个最大切分单位的,这就是为什么我们不会把标题写成一句很长的话,里面带有我们所有关键词的原因,因为搜索引擎的切分单位设置的不会很大,如果你的关键词很多,你把所有的关键词包含在一句话里面的时候,搜索引擎不一定能够全部分出你的关键词,就算全不分出了也不一定合你的心意,这就是为什么我们要把关键词用某些符号隔开的原因。
第二类是基于统计的分词方法。统计分词法就是根据词组的统计,就会发现两个相邻的字出现的频率最多,那么这个词就很重要。就可以作为用户提供字符串中的分隔符。这样来分词。比如,“seo,seo技术,许多的,这里,这一,那里”。等等,这些词出现的比较多,就从这些词里面分开来。
如何来运用分词技术为我们的站点带来流量?
不但这些分出来的长尾词能够获取一定的排名,也能够推动站点的目标关键词获取很好的排名,我们举个例子。
例如:优友重庆旅游网,如何来分呢?
1、重庆优友旅游网
2、旅游网:重庆优友uu023.com
3、优友重庆旅游网
这些词每个都可以做一个主题页为目标关键词,这些分出来的词,把他们都作为你站点的主题页,一旦导入链接权重上来了,竞争力就大了,因为这些页面把他内链起来。用锚链接,指向主页的目标关键词。这就是分词的好处。他能够提升目标关键词的排名的竞争力也同时给站点带来一定流量。
分词还有一种好处,那就是提升内页的排名。大家可以去看一下,就是关于百度,捕获描述的文章。如果你的内页不做描述,那么百度就会给你定义一个描述或者从你的页面捕获一个描述。在捕获描述的时候,如果你知道他会捕获哪一段,那么你说,你的排名会不会上升?很简单的道理。
歡迎光臨 SCLUB免費論壇申請-使用者論壇 (http://sclub.com.tw/discuz/)
Powered by Discuz! 7.2