星期日, 11月 28, 2021
spot_img

TAG

算法

抖音、小红书、知乎、视频号的流量算法

想搞懂抖音小红书知乎视频号流量算法,看这一篇就够了?

百度升级『蓝天算法』,加强“站点构造目录发布低质内容”识别能力

百度搜索将全面升级“蓝天算法”,2.0版本的蓝天算法会增强对上述现象的识别和控制能力

百度细雨算法升级-打击B2B领域低质内容

对于近期B2B领域出现的伤害搜索用户体验的违规低质内容,百度搜索将升级细雨算法,上线细雨算法2.0。 *B2B领域主要包含:供求黄页、加盟代理、生产代工、批发交易等内容。 此次细雨算法2.0将覆盖百度搜索下的PC站点、H5站点、智能小程序内容。对于算法覆盖的站点或智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。 本次细雨算法升级共涉及以下两类问题: 一、恶劣违规内容: 1、页面内容恶劣采集。 如:拼接内容、纯采集内容、跨领域采集内容等。 问题示例:B2B领域小程序采集时事新闻 2、发布软文信息。 问题示例:利用小程序页面发布软文,页面标题是“垃圾车厂家哪家好“,内容是品牌软文,对用户产生误导 3、发布无法满足用户需求的空白页面,对用户完全无价值。 问题示例:该小程序页面为空白页面 4、商品信息有误。 如:商品详情、价格等与实际情况不符 问题示例:商品价格与实际情况不符 5、功能不可用。 如:交易、联系电话、查看详情等交互功能不可用等情况。 二、低质内容: 1、图片内容低质。 如:图片内容与文字描述不一致、图片嵌入电话号码、图片质量极低影响阅读体验等。 问题示例:图片中大量嵌入联系电话 2、页面内容低质。 如:页面中只有图片无有效信息,或信息提供不完善等情况。 问题示例:网站仅有图片作为展示,没有文字说明 细雨算法2.0 将在近期陆续上线。请大家积极自查完成整改,避免不必要的损失。

simhash和海明距离-解决海量数据相似度计算

一种应对于海量数据场景的去重方案,经过研究发现有种叫 local sensitive hash 局部敏感哈希 的东西,据说这玩意可以把文档降维到hash数字,数字两两计算运算量要小很多。查找很多文档后看到google对于网页去重使用的是simhash,他们每天需要处理的文档在亿级别,大大超过了我们现在文档的水平。既然老大哥也有类似的应用,我们也赶紧尝试下。simhash是由 Charikar 在2002年提出来的,参考 《Similarity estimation techniques from rounding algorithms》 。 介绍下这个算法主要原理,为了便于理解尽量不使用数学公式,分为这几步: 1、分词,把需要判断文本分词形成这个文章的特征单词。最后形成去掉噪音词的单词序列并为每个词加上权重,我们假设权重分为5个级别(1~5)。比如:“ 美国“51区”雇员称内部有9架飞碟,曾看见灰色外星人 ” ==> 分词后为 “ 美国(4) 51区(5) 雇员(3) 称(1)...

网站运营如何做好SEO

现在的SEO优化重点和核心应该放在什么方向呢?

算法是如何左右用户决策的?

互联网科技的恐怖之处不在“窃取”我们的隐私,而在于那些打着“给我更优质服务”旗号的所谓人工智能算法正在不断侵蚀我们的心智,影响我们的决策。

百度细雨算法 惩罚黄页类B2B站点

为保证搜索用户体验,促进供求黄页类B2B站点生态健康发展,百度搜索将于7月中旬推出细雨算法,命中算法的站点将会受到限制展现的处罚。

Latest news

- Advertisement -spot_img