本文部分内容来源于《百度搜索资源平台》,感兴趣者可前往订阅。
2020年末百度搜索线上公开课的收官之课,从如何让百度搜索选择我开始,罗列了一些常见的搜索算法问题,本次我们来详细解读百度搜索算法规范,百度搜索排序原则的相关内容,为开发者排雷。
建立一个站点时,如何让自己的内容获得更多的流量,这是站长们最迫切关注的点。
市面上的网站非常的多,搜索引擎怎么发现一个站点?最基础的先让爬虫认识这个站点,刚开始爬虫可能会做基础的筛选,某些站最初的表现不大好,因此对它的时间投入没有那么多。
有些站长觉得为什么做了好久都没有得到抓取的流量,站点的抓取流量需要不断积累,把过程都搭建好,等待百度蜘蛛收录内容便可。
新站:想先让百度认识,新站做一些外链的交换利于被发现,也可以使用主动提交到百度站长平台发现网站。
老站:如果老站点原本保持的比较好,历史的行为都不错,那相对新站来说,这个老站点会更好一些。
首页内容要保持更新速度,持续优化,视觉上给用户的体验感官要简单明了,主题内容明确,无其他复杂的信息,总的来说就是带给用户各种好的体验。
站点的结构要清晰,内容有清晰的层级逻辑,主页>目录>进一步的目录>内容详细页>内链回其他层级,形成一个树状结构,并且反应在URL的结构上。
不希望有负向评价,应提前做好准备,做好对于内容的清理和限制,死链内容要正确404,避免蜘蛛来到您的站点时,浪费太多时间和流量在这种无价值的内容的浏览上,抓取到不利于网站的信息。
其他的体验细节也要细心维护,避免模板化的内容,就是直接从别的网站复制过来,借用了别人的信息,搜索引擎也将宏观的判断好与坏。不要影响用户对内容的获取便利性,不要过快的追求流量提升,这样可能存在欺骗搜索引擎的行为。
一开始许多新站不清楚网站该如何布局和规划,可通过5118的「网站排名词导出」功能,学习一些优质网站的排名词布局。
再通过排名词目录,能够很好的了解同行或优质网站哪些目录的排名效果最好,获取目录中拥有排名的关键词,便可更好的展开新站布局。
关于内容创作,该怎么围绕自己的需求出发?
现象:头部的需求比较拥挤,流量分配不均,流量会被分配到大的历史长久的站点上;中长尾搜索内容质量偏低甚至恶劣,内容供给不足。
建议:可以选择做稍微小众的领域和内容输出,领域越精细化和集中,越有利搜索排序。
相对冷门领域:本地生活、政务、生产制造、体育、历史等。
相对冷门的领域围绕它们生产内容,流量价值并不会差。
有经验的站长在做SEO时,总会有许多办法找到一些搜索词,除了我们常用的长尾词挖掘,
在5118的其他挖词功能中,同样可以多维度的挖掘出更多扩展词汇。
例如:高尔夫球、五线谱,这些看起来较小众的词,竞品还没那么多,若围绕这些信息做内容,出头的机会也非常大。
高尔夫球「需求图谱」
高尔夫球「疑问词提取」
03不建议的建站行为
1、如果网站结构比较复杂,层级逻辑零散,蜘蛛在抓取的时候很难层层抓取,这情况一般针对新站点。如果已经维护一段时间的站点,结构性比较清晰时,这方面的关注度会相对减弱。
2、网站刚建立没多久,为了获得抓取量疯狂的做内容,做出来的质量是偏差的,这时候反而适得其反,由于百度判断该站点好坏的时候,是根据用户所反馈的行为,做出判断,如难以获得关注,不注重自己的综合质量时,得到的结果固然适得其反。
3、使用其他网站的模板或大量常见模板建站,这一般会在站群出现的行为,站群通常使用模板化的手段,建立大量站点,存在被算法命中的风险。应该建立起自己网站的特殊风格,反而更能得到关注。
4、为了增加内容相关度,虚构相关热点词在标题或正文内。仿佛是去告诉搜索引擎您与哪些内容非常相关,但实际上并不相关,这种行为也是不建议,一旦发现,被搜索引擎遗弃的可能性极大。
5、刻意增加内容篇幅长度、翻页。例如一篇文章的知识储备只能支撑400字,但为了增加内容硬加到2000字,这是毫无意义的行为,内容过长的页面,或增加一些无意义的翻页,对收录并没有什么帮助。
6、领域不集中,内容零散。一个网站看似什么都了解什么都做,但其实什么都不精,没有一个专注领域,这个不仅仅在百度,在其他平台同样不受欢迎。
7、广告干扰用户在浏览过程中的行为,不利于对该网站价值的判断。
当做出的内容,不确定内容质量是否利于收录,可通过5118的「原创度检测」功能,快速检测文章的原创度,判断文章是否可以在网站中使用,避免同质化内容,规避风险。
原创度提高后,如想检测文章是否能在搜索引擎中获取排名机会,通过「文章排名预估」功能,将自动评估文章给出结果,并显示修改建议。
04搜索算法近期关注的问题
百度做算法的发布,都是围绕着风雨雷电的名称,打击作恶是百度主要的目标。
如想了解百度以往推出过哪些算法,可回顾5118往期发布的《2013-2019百度搜索算法规则详解》。
下面来看看近期百度在关注的问题
文不对题
恶意拼凑
广告干扰
误导欺骗
功能失效
主要在这几方面,如有这些情况的网站,建议及时整改。
文不对题
有些年纪比较小的用户,发说说信息时,会在百度上找说说配图,但文章里并没有配图,也没有很丧,这并不符合用户需求。
恶意拼凑
不少用户会关注自己的运势,例如想了解2020年10月的运势,但该内容是由农历2018年的内容被改成2020年当作自己的内容,部分人会相信民间习俗,这种信息对于用户会造成较大损害。
广告干扰
一个家装类的网站,把标题写得比较显眼,但内容挂了一大堆自己站点的广告,而页面内容与装饰叶子没有过多关联,一方面有恶意拼凑,一方面是广告干扰。
误导欺骗
从标题进入后,内容整体并没有什么有营养的信息,误导欺骗用户点击关注。
功能失效
提问和回答测题的内容,但内容却没有答案,该网站不仅仅没有提供有价值信息,且尝试让公众号得到关注,这种行为也是比较恶劣的。
列举的这些案例,也是希望大家能更好的感受到,当自己作为一个搜索用户时,看了这些内容,是什么样的反感体验?这种行为的伤害,百度都会极力反对,且将持续监控这类伤害用户体验的问题。
如想快速根据一个词找到优质的内容,借助「智能段落库」功能,便能自动搜集到相关的精华内容及图片,丰富写文的素材灵感。
05百度搜索排序原则
1、百度搜索结果按照用户的综合需求满足程度从高到低排序。
2、考察维度
(1)百度搜索排序原则中需要重点考察的四个维度分别是:内容质量、权威性、浏览体验、时效性。
内容质量:资源本身所传递的价值高低。
一般案例:内容质量一般,简单地总结了探春的性格特征。
优质案例:内容质量优质,文字优美,在总结探春的性格特征之外,还运用了具体细节事例加以佐证,有理有据。
权威性:资源背后的生产者的专业程度。
反面案例:在回答“健身减肥”领域的问题时,该生产者缺乏相关领域的认证,缺乏权威性。
优质案例:在回答“健身减肥”领域的问题时,该生产者专注该领域的内容生产,且有平台“优质达人”的认证,具有一定的权威性。
时效性:资源的发布时间和内容的新旧程度。
左图(反面案例)内容资源没有及时更新,仍然是考试时间未确定的答案;
右图(优质案例)内容在考试时间确定后及时更新内容,满足用户需求。
浏览体验:用户消费内容或服务过程中的体验流畅度。
左图(反面案例)页面挂件多,正文被部分遮挡,造成阅读障碍,广告与正文间距小,易引起误点击;
右图(优质案例)正文无广告无挂件,浏览体验好。
(2)百度搜索排序原则的基本要求是内容相关性以及满足用户需求的主次程度。
相关性:资源对用户需求的匹配程度
左图(优质案例)内容符合题目问题,相关性高;
右图(反面案例)内容与题目问题无关。
需求主次:用户搜索时的主要意图和次要意图
搜索“鸡胸肉”时,左图为用户主需内容,右图为用户次需内容。
(3)百度搜索排序原则中不准入的内容资源包括:算法违规内容、低质内容、高获取成本内容。
(反面案例)
左图内容资源文不符题,为低质内容;
右图内容资源涉及恶意采集。
3、搜索排序原则总结
(1)内容质量是搜索排序原则中最重要的考察维度。
(2)关于医疗、法律等领域专业度要求高的内容需求,内容的权威性很重要。
(3)关于突发事件、价格等因素的内容需求,内容的时效性很重要。
(4)其他都差不多的情况下,搜索排序原则中单一维度越好的资源,搜索排序越靠前。
4、搜索如何判断一个内容的好坏
(1)看出身:知名、专业、权威、可信
(优质案例)
左图内容生产者知名、有影响力;
右图内容生产者是该领域的专业人士。
(2)看内涵:丰富、深度、实操、生动
优质案例:内容实操性强,富有深度。
(3)看颜值:排版、结构、配色、格调
优质案例:配色好看,结构清晰,生动有趣。
(4)看口碑:评论、点赞、收藏、分享
优质案例:该内容观看量超500万,有2.9万弹幕,口碑上佳。
当储备了这些优质内容后,除了自己的网站以外,大范围的推广才能更好的提高自己产品的曝光率,通过「引流渠道挖掘」功能,输入一个您想要引流的关键词,将自动获取到哪些网站平台拥有最多的目标排名词,当结果显示某个网站覆盖关键词越多,说明如果您在这个网站中进行推广,将会得到较大的引流效率,收益更高。
06给开发者们的建议
1、贴近搜索用户的需求生产优质内容。
2、严控内容质量:及时翻修、更正瑕疵内容,持续生产优质内容。
3、在擅长的专业领域内持续深耕优质内容,提高内容权威性。
4、页面设计风格统一、美观、有格调;交互设计流畅,打造良好的用户体验。
本文分享到此结束,站点从零到有的过程,让站点获取关注,让搜索引擎初步认识,保持好的行为,积累优质的流量,终将成长为一个优质的站点。
在此,感谢大家对5118的支持与陪伴,新的一年,我们不忘初心,砥砺前行!
下面附上2020年5118的主要功能更新,一步一脚印,百次淬练,只为更好的你们。