一、中文分词算法

    本次主要解决什么是中文分词,为什么要做中文分词 对搜索引擎的作用?通过附子老师的笔记进行记录
①、首先中文分词
    中文分词:本人理解为 我们在用百度搜索内容时,一个普遍现象 大家搜索100条内容时,大约有99条搜索内容都是中文, 很少会出现英文的相关搜索,百度会把我们搜索的内容进行分词处理
②、搜索引擎可以根据中文分词算法来识别一个网页核心的主题

     可以通过分词算法,把我们一张网页上的每一个词可以分的非常清晰,通过这一个词的分析以后,还会通过其他算法比如 :TF-IDF算法等定义网页的主题。
③、如图所示

seo1.png

将这句话分词分解:
        小明 是 一个 非常 喜欢 跑步 的 小男孩
      百度引擎就会根据相关算法,提取这句话的信息,进行处理,后面会介绍到.我们的网页中 搜索引擎会用分词算法把网页内容、词拆分 ,然后得到一组数据,搜索引擎进行计算 得到网页上总体词库数量,网页就会知道你网站所写的是什么。
  以上一句话中有九个词
  比如这一句话做一个标题: 小明的个人介绍

seo2.png

注意:搜索引擎中文分词分两种
1、整个标题作为中文分词拆分
2、把整个网页内容作为词的拆分
比如 标题: 为 小明 的 个人 介绍 四个词
       内容为:小明 是 一个 非常 喜欢 跑步 的 小男孩
        我们肉眼可知 ,标题中有小明,内容中也有小明,作为用户显然这句话是讲小明的。 但是搜索引擎并不知道,它会通过分词方法一个一个对比,然后得出这句话是讲的小明。 但是我们会有疑问 : 标题中出现“的”、 内容也有“的” ,为什么搜索引擎会知道这句话是讲“小明”而不是讲“的”?原因是搜索引擎中有词的重要性、在我们千千万万的词类中 不同的词重要性不同。我们了解即可

二、中文分词算法里面不仅有分词,还有分词符号(如下图所示)
①、用中括号将关键词分开。

seo3.png

②、第二张用括号将关键词强调

seo4.png

以上两张图都有分词符号,举个简单的例子:

seo5.png

千聊app周围添加双引号,是把千聊app作为重点,这样我们就可一将关键词给重点强调。

三、完全匹配与不完全匹配

      (不完全匹配)示例图 1

seo6.png

      (不完全匹配)示例图 2

seo7.png

        可以看到,第二张图中 搜索引擎优化 附子老师的网站在搜索的首页, 附子老师的标题为“搜索引擎优化培训需要学习哪些知识?-附子seo培训” 并不是完全匹配 搜索引擎优化学习 这几个词 而是全部匹配。
部分匹配:以上第二张图百度百科没有学习两个字,所以为部分匹配。

seo优化的是搜索词而不是关键词
      不要用完全匹配 规避降权一些东西,尽量少完全匹配 关键词多了会降权
搜索引擎会先分词再做匹配。
注意:        附子老师首页 百度快照 seo培训出现19次 seo出现80次 培训出现33次 ,不要只看表面,搜索seo培训 附子老师的网站 实际出现关键词100多次、
四、seo内页排名优化:
    比如附子老师讲的 搜索引擎优化学习 这个词 首先要把自己网页的词定位好,定位好后在对应的网页中(自己写的想要排名的网站)出现的频率是最高的 其次你这个词在你的所有网页中(包括其他的别的网站 自己的所有网站)最好是唯一性的存在,就比如附子老师千聊app在 附子seo中一样,如果不是唯一性的存在,那么搜索引擎会在你大量的重复的页面当中,去提取一个质量最好的来展现。
    所以,页内排名要:
1、关键词突出(标题上)
2、主题内容里面改词频率体现集中(较高,让搜索引擎好定位这个词)
3、内容排版 结构整洁 图文并茂 网页速度快
4、通过分词符号等行为来把词隔离,让搜索引擎定位网页核心关键词
5、优化的词放在标题最前面,突出重要性