简要介绍了新列表指数的算法

 百度处理     |      2022-02-17 11:25

       新闻发布在很大程度上是为了被百度收录,甚至很多评估指标都是有多少新闻链接进入百度的新闻来源,是否被百度及时抓取和收录,而不是看新闻链接的数量,不包括等于忙碌。一般来说,离线和在线活动,与新闻合作,BBS/贴吧和微信官方账号转发会增加用户搜索量,增加用户关注度和媒体关注度,但也有不同步的时候,说明沟通不是很吸引用户的注意力。

           从媒体的关注可以看出企业的营销行动。相关条款的数量显示了新闻稿的数量,百度最喜欢的媒体是什么,包含的节奏显示了发布的频率。对于许多初创品牌来说,发布的手稿更多的是由企业积极传播的。对于知名品牌来说,媒体发布的手稿更多,褒贬不一,更中性。当品牌陷入危机时,媒体会争相报道。

       3)用户肖像趋势分析

           从百度指数用户肖像分析来看,自2017年1月以来,饥饿用户分布在上海、北京、广东、美团:广东、北京、江苏、百度外卖:北京、广东、上海。显然,这三个用户的活动是不同的,这反映了市场交付策略。

           通过用户年龄分析,饿了么、美团外卖、百度外卖三个品牌在19岁以下至29岁之间的用户中排名。这三个品牌的份额差别不大,但也有差异,但在30个消费实力更好的品牌中-在39岁的人群中,百度外卖、美团外卖和饿了么三家公司的顺序发生了逆转。这是否意味着饿了么在校园市场更强大?可以结合更多的数据进行比较和确认。在性别方面,饿了么更受男性用户的欢迎,而女性用户更喜欢另外两个,这与品牌形象设计有关吗?例如,美团外卖的广告主要是高外表水平的英俊男孩,百度外卖是百度熊。

       4)用户需求图分析

           通过指数需求图,了解用户背后的其他需求和兴趣点,以及他们和品牌/产品距离可以指导产品分析和营销传播。

           简而言之,百度指数作为一种重要的公共数据测量工具,无论是在APP运营、品牌传播、市场分析等领域都很有价值WMS全球营销系统的重要数据参考。

       10.2.2新榜自媒体指数

           新榜指数(New Rank Index,NRI)由新媒体排名(newrank.cn)基于海量数据、用户深度反馈和专家建议,用于衡量中国移动互联网渠道新媒体(主要指两个微端)的沟通能力,反映了新媒体主体的热度和发展趋势。几乎所有的我们媒体都接入了新列表指数的插件,新列表指数已成为公共账户热度最重要的评价标准。

           新榜指数算法简述

           新列表指数是由原始数据参考基数通过计算公式推导的标量值,以衡量原始数据在其维度的相对性能。xx点赞数为:379。我们将比较这些数据和点赞常数,以确定其点赞数的相对位置,然后将其转换为其点赞指数,以此类推。

           与常规加权相比,该算法有四个优点:

           ①不仅显示绝对表现,还反映位置;

           ②标准化后,不同维度的指标可以相互比较;

           ③指标可以相互操作,从而获得各维度综合调查的新榜单指数;

           ④不仅可以用于账户间的比较,也可以用于账户本身的跨期比较。

       1)选择指标

           在微信计算中,为了考虑其数量和质量,我们使用五个指标来评估账、平均阅读、标题阅读和总拇指五个指标来评估账户,包括:

           (1)总体指标(总阅读数,R):指统计周期内所有发布内容的阅读总和;

           (2)优秀指标(最高阅读,Rm):指统计周期内所有发布内容中单篇文章的最高阅读数;

           (3)质量指标(平均阅读数,Ra):统计周期内所有发布内容的阅读平均值;

           (4)主动预测指标(阅读头条,Rh):标题内容的阅读总数位于统计周期;

           (5)互动指标(总赞数,Z):统计周期内所有发布内容的赞数总和。

       2)指标标准化

           基于不同维度指标的差异,我们首先标准化所得数据,即通过计算各维度原始数据与该维度常数之比,获得样本指标的千分化值。

           在新榜单指数中,以天为最小计算周期,将常规微信官方账号(每天推一次,每次最多8篇)作为此期间总阅读量、最高阅读量、平均阅读量、头条阅读量、五个指标的对象,分别记为:

           结合新列表历史数据样本库和微信平台发布规则——常规微信公众每天发布8篇,每次阅读10000-我们记录8000000总阅读指数理论上1000分,对于一些特殊账户,如人民日报、央视新闻,理论上可以得到1000分。

           所以: 所以:

           即日、周、月、年(n=1、7、30、365)下,上述常数的具体值为:

           在此基础上,各指标按以下公式标准化:

           注:①此处“+1是为了避免类似0阅读的无效值。

           ② ln如果是自然对数a的x次方等于N(a>0,且a不等于1),那么数X叫做以a为底N的对数(logarithm),记作x=logaN。其中,a称为对数底数,N叫真数。无理数e(e=2.71828…)对数称为自然对数(natural logarithm),并记为ln。

           线性回归取对数后的数据,取对数后不会改变数据的性质和关系,获得的数据容易消除异方差问题;同时,取对数后,经济变量具有弹性意义,因此变量取对数一般形式。

           指标加权

           由于这五个数据对微信传播能力的影响不同,我们分别给出了不同的权重ωR,ωRm,ωRa,ωRh,ωZ。

           最后,新榜单指数的计算公式表示:

           目前,我们使用的系数是ωR=0.75,ωRm=0.05,ωRa=0.1,ωRh =0.05,ωZ=0.05。

           新列表始终认为,不同类别之间的简单比较是毫无意义的。因此,当发布需要跨类别比较的月度列表,即中国微信500强时,出类别系数,突出渠道价值。具体系数表如下:

           算法中使用数据的统计口径

           日常列表的统计周期为0:00至24:00,统计截止日期为次日中午12:00,以确保子夜出版商至少能传播12小时。每周列表的统计周期为所示日期范围(从周一0:00到周日24:00),统计截止日期为下周一中午12:00。需要注意的是,我们的每周列表不仅仅是每日列表数据的总结,而是为了记录长尾效应,每月列表和每年列表也是如此。

           Tips

           根据腾讯的官方政策,微信影响列表中列出的微信阅读数量仅指前台显示的数据,超过10万的数据可能与微信管理后台显示的数据不一致。

           FQA

           ①为什么要设定常数?

           就像我们将1米定义为平面电磁波(光)在1/(299 792 458)秒的持续时间内在真空中传播行经的长度一样。我们根据理论值和实际观测值设置了各指标的相对参考值,用于整合各指标。

           ②1 000分是最高分吗?

           不是。然而,1000分可以被视为常规号码(每天发布一次)可以达到的极限——发布8篇文章,每篇文章阅读10万篇,大拇指1万篇。然而,《人民日报》、《中央电视台新闻》和其他拥有每天多次推送权限的账户理论上可能超过这个分数;

           ③为什么常数设定中的赞数最高值不是10万,而是1万?

           在实际监测中(超过1000万篇文章样本),新榜的技术人员观察到了6万多个+单赞数,但这是一个极其特殊的例子。通过测试样本分布(单赞1万以上样本比例远小于万分之一),我们选择1万作为理论上限;

           ④如果发布上限从8篇文章开始,算法会经常改变吗?/天变成了10篇/天?

           新列表指数的核心价值是为所有账户提供参考系统。只要参考系统稳定,比较就有意义。稳定的系统更有利于长期观察和测量;

           类似微信官方策略的变化只会使总阅读指标更容易达到1000分甚至超过这个分数,但对该算法没有决定性影响;

           新榜技术人员对数据环进行会议