热点聚集

之前看到各大搜索引擎的原始识别和权重继承算法分析这个文案,写的不错,但是一般学生不太容易理解,有些算法就不提了。

对于原始识别,可以提取原文中提到的关键词,然后使用md5或频率目标法,但实际应用可能不是很有效。在各大搜索引擎对原文的识别中,根据关键词词频(tf)的比较,有一些低级,也就是说文本太多,容易误判。因此,需要另一个指标来评价。这个方法是切片比较。按照固定的步长对文本进行切片,比较其相似度,会更接近真实结果。切片比较可以很好地识别段落混乱的伪原始方法。

[新闻营销]SEO原创识别具体应用与站内权重继承算

页面降噪技术被各大搜索引擎广泛采用。对于大部分标题+文本的文本,可以利用降噪技术获得接近真实文本的文本。然后在seo中,需要在文本中间加入干扰因素,打断各大搜索引擎的推广和切片。添加的文本可以使锚文本链接,也可以使段落关联。而且这种方法还会打乱各大搜索引擎的矢量化解决方案。

[新闻营销]SEO原创识别具体应用与站内权重继承算

原文中也提出了站内权重继承的问题。站内页面权重继承没有原作者说的那么简单,权重分布也不是简单的平均分布。而且为了防止网站在短时间内大量制造内链来提高自身的权重,在网站中权重传播的过程中加入了阻尼基,通常为0.15。也就是说,如果一个页面有一百个导出链接,其中15个不会参与权重传播。根据链接出现的位置,链接在每个位置得到的权重继承是不同的;根据链接使用的标签不同,每个链接得到的权重继承也不同;根据关联程度的不同,每个环节得到的权重继承是不同的。这里补充的是,由于去噪或抑制基数,某些位置的链接可能会被优先消除。

[新闻营销]SEO原创识别具体应用与站内权重继承算

权重继承算法是一个复杂的公式,类似于谷歌pr公式。原文还提到了一个对汉语语法的应用。其实各大搜索引擎并不太关注中文语法,只需要找出stopword,这里的stopword可以是任意词性,也可以是任意语法单位。各大搜索引擎都把抽取的词当做名词,而偏向于褒义词。因为客户的搜索动作是中性的,不会给搜索关键词赋予感情色彩。也许以后会有情感搜索引擎,让你选择搜索时的情感状态,返回不同的结果,但现在看来,有点理想化。

[新闻营销]SEO原创识别具体应用与站内权重继承算

虽然各大搜索引擎不区分词性,但是区分了。因为语气可以评价客户的需求。当你搜索糖果的时候,各大搜索引擎都无法评价你是在找好吃的糖果,还是一个企业品牌,还是糖果的功能。但是当你搜索糖果的时候,各大搜索引擎都能评价出你的需求非常旺盛。也许你在寻找最好的糖果,也许是最贵的糖果,或者是最丑的糖果,等等。

[新闻营销]SEO原创识别具体应用与站内权重继承算

这里很难理解,因为“最好吃的糖果”这个词包含了形容词“好吃”,但是我前面说过,各大搜索引擎不区分词性,只区分语气。在这里,“最”代表的是语气,“好吃”只是作为名词对待。可以百度“好糖果”和“好糖果”。看看百度的结果就能发现这个问题。排名靠前的标题通常是带有疑问或强调语气的标题。

上一篇:[新闻营销]解读百度谷歌优化指南打造正确网站

下一篇:[新闻营销]怎么建设效果最佳的外链的几点心得


标题:[新闻营销]SEO原创识别具体应用与站内权重继承算
地址:http://wenfangge.com.cn/xinwen/25918.html


免责声明:文芳阁软文营销平台所转载内容均来自于网络,不为其真实性负责,只为传播网络信息为目的,如有异议请及时联系btr2030@163.com,本人将予以删除。