联系方式:400-625-5526

项目经理建立数据思维的13个必备工具

2022-07-27

01、信度与效度思维

1.jpg

信度与效度的概念最早来源于调查分析,但现在引申到数据分析工作的各个方面。


信度是指一个数据或指标自身的可靠程度,包括准确性和稳定性。


取数逻辑是否正确?有没有计算错误?这属于准确性;每次计算的算法是否稳定?口径是否一致?以相同的方法计算不同的对象时,准确性是否有波动?这是稳定性。


做到了以上两个方面,就是一个好的数据或指标了吗?其实还不够,还有一个更重要的因素——效度。


效度是指一个数据或指标的生成,需贴合它所要衡量的事物,即指标的变化能够代表该事物的变化。


只有在信度和效度上都达标,才是一个有价值的数据指标,例如,要衡量我身体的肥胖情况,我选择了穿衣的号码作为指标。


一方面,相同的衣服尺码对应的实际衣服大小是不同的,会有美版、韩版等因素,使得准确性很差。同时,一会儿穿这个牌子的衣服,一会儿穿那个牌子的衣服,使得该衡量方式形成的结果很不稳定。所以,衣服尺码这个指标的信度不够。


另一方面,衡量身体肥胖情况用衣服的尺码大小?你一定觉得很荒唐,尺码大小并不能反映肥胖情况,因此效度也不足。

在现实工作中,许多人会想当然地拿来指标就用,这是非常值得警惕的。你要切骨头却拿了把手术刀,是不是很可悲?信度和效度的本质,其实就是数据质量的问题,这是一切分析的基石,再怎么重视都不过分。

02、平衡思维

2.jpg

说到天平大家都不陌生,平衡思维相信各位也都能很快理解。简单来说,在数据分析的过程中,我们需要经常去寻找事情之间的平衡关系,且平衡关系往往关乎企业运转的大问题,如市场的供需关系,薪资与效率的关系,工作时长与错误率的关系等。


平衡思维的关键点,在于寻找能展示出平衡状态的指标!也就是如图中红框,我们要寻找这个准确的量化指标,来观察天平的倾斜程度。

怎么找这个指标呢?一般人的经验是先找双向型的问题,即高也不是低也不是的问题,然后量化为指标,最后计算成某个比率,长期跟踪后,观察它的信度和效度。


03、分类思维

3.jpg

客户分群、产品归类、市场分级、绩效评价.......许多事情都需要有分类的思维。主管拍脑袋也可以分类,通过机器学习算法也可以分类,那么许多人就糊涂了,到底分类思维怎么应用呢?


关键点在于分类后的事物,需要在核心指标上拉开距离!也就是说分类后的结果必须是显著的。如图中的横轴和纵轴往往是你运营中关注的核心指标(当然不限于二维),而分类后的对象的分布不是随机的,而是有显著的集群的倾向。


例如,假设该图反映了某个消费者分群的结果,横轴代表购买频率,纵轴代表消费单价,那么绿色的这群人,就是明显的“人傻钱多”的“剁手金牌客户”。

04、矩阵思维

1658891672638346.jpg


矩阵思维是分类思维的发展,它不再局限于用量化指标进行分类。许多时候,我们没有数据作为支持,只能通过经验推断,可以把某些重要因素组合成矩阵,大致定义出好坏的方向,然后进行分析。

05、漏斗思维

5.jpg

这种思维方式已经普及:注册转化、购买流程、销售管道、浏览路径等,大多数的分析场景中,都能找到这种思维的影子。

但看上去越是普适的、容易理解的模型,应用时越得谨慎和小心。在漏斗思维中,我们尤其要注意漏斗的长度。


漏斗从哪里开始到哪里结束?以我的经验,漏斗的环节不该超过5个,且漏斗中各环节的百分比数值,量级不要超过100倍(漏斗第一环节100%开始,到最后一个环节的转化率数值不要低于1%)。

理由是什么呢?超过5个环节,往往会出现多个重点环节,那么在一个漏斗模型中分析多个重要问题容易产生混乱。数值量级差距过大,数值间波动相互关系很难被察觉,容易遗漏信息。例如,漏斗前面环节从60%变到50%,让你感觉是天大的事情,而漏斗最后环节0.1%的变动不能引起你的注意,可往往就是这0.1%的变动非常致命。

这种思维方式已经普及:注册转化、购买流程、销售管道、浏览路径等,大多数的分析场景中,都能找到这种思维的影子。

但看上去越是普适的、容易理解的模型,应用时越得谨慎和小心。在漏斗思维中,我们尤其要注意漏斗的长度。

漏斗从哪里开始到哪里结束?以我的经验,漏斗的环节不该超过5个,且漏斗中各环节的百分比数值,量级不要超过100倍(漏斗第一环节100%开始,到最后一个环节的转化率数值不要低于1%)。

理由是什么呢?超过5个环节,往往会出现多个重点环节,那么在一个漏斗模型中分析多个重要问题容易产生混乱。数值量级差距过大,数值间波动相互关系很难被察觉,容易遗漏信息。例如,漏斗前面环节从60%变到50%,让你感觉是天大的事情,而漏斗最后环节0.1%的变动不能引起你的注意,可往往就是这0.1%的变动非常致命。

06、相关思维

6.jpg

我们观察指标,不仅要看单个指标的变化,还需要观察指标间的相互关系。有正相关关系(图中红色实线)和负相关关系(图中蓝色虚线)。最好能时常计算指标间的相关系数,定期观察变化。

建议大家养成一个习惯,经常计算指标间的相关系数,仔细思考相关系数背后的逻辑,有的是显而易见的常识,例如,订单数和购买人数,有的或许就能给你带来惊喜。另外,“没有相关关系”,这往往也会成为惊喜的来源。

07、远近度思维

7.jpg

确定好核心问题后,分析其他业务问题与该核心问题的远近程度,由近及远,把自己的精力有计划地分配出去。

例如,近期你的核心任务就是提高客服人员的服务质量,那么客服人员的话术、客户评价通道、客服系统的相应速度等就是最近的问题,需要重点关注,而客户的问询习惯、客户的购买周期等是相对远的问题,暂时可先放一放。


08、逻辑树思维

8.jpg

图中的逻辑树思维相信大家已经见过多次,一般说明逻辑树的分叉会提到“分解”和“汇总”的概念。这里把它变一变,使其更贴近数据分析,称为“下钻”和“上卷”。

所谓下钻就是在分析指标的变化时,按一定的维度不断地分解。例如,按地区维度,从全国到各省,从省到市,从市到区。

上卷就是反过来。随着维度的下钻和上卷,数据会不断细分和汇总,在这个过程中,我们往往能找到问题的根源。

例如,我们发现全国客户数量下降了,我们从地区和客户年龄层级两个维度先进行观察,发现各个年龄段的客户数量都下降了,而地区间的客户数量有的下降有的升高,那就按地区来拆分第一个逻辑树节点,拆分到区后,发现各省间的差别是显著的,那就继续拆分到市,最终发现是浙江省杭州市大量客户数量下降了,且涵盖各个年龄段,被竞争对手的一波推广活动转化走了,通过这三个层级的逻辑树找到了原因。

09、时间序列思维

9.jpg


很多问题我们找不到横向对比的方法和对象,那么,和历史上的状况比,就将变得非常重要。其实很多时候,人更愿意用时间维度对比来分析问题,这种方式容易排除掉一些外在的干扰,尤其适合创新型的分析对象,例如。一个新行业的公司或者一款全新的产品。


时间序列的思维有三个关键点。


一是距今越近的时间点,越要重视(图中的深浅度,越是近期发生的事,越有可能再次发生);二是要做同比(图中的尖头指示,指标往往存在某些周期性,需要在周期中的同一阶段进行对比才有意义);三是异常值出现时,需要重视(例如,出现了历史最低值或历史最高值,建议在时间序列做图时,添加平均值线和平均值加减一倍或两倍标准差线,便于观察异常值)。


10、队列分析思维

1658891854639053.png

举个经常用的例子,假设5月17日我们举办了一次促销活动,那么将这一天来的新用户作为一个观察样本,观察他们在5月18日、5月19日......之后每天的活跃情况。


队列分析中,指标其实就是时间序列,不同的是衡量样本。队列分析中的衡量样本是在时间颗粒上变化的,而时间序列的样本则相对固定。

11、循环/闭环思维

11.jpg

循环/闭环思维的概念可以引申到很多场景中,例如,业务流程的闭环、用户生命周期闭环、产品功能使用闭环、市场推广策略闭环等。许多时候,你会觉得这是一个不落地的概念,因为提的人很多,干出事情来的却很少。

但是,这种思考方式是非常重要的。业务流程的闭环是管理者比较容易定义出来的,列出公司所有业务环节,梳理出业务流程,然后定义各个环节之间相互影响的指标,跟踪这些指标的变化,能从全局把握公司的运行状况。


12、测试/对比思维

12.jpg


测试/对比思维大家肯定不陌生。那么,怎么细化这两个概念?一是在条件允许的情况下,决策前尽量做对比测试;二是测试时,一定要注意参照组的选择,建议任何实验中,都要留有不进行任何变化的一组样本,作为最基本的参照。


现在,数据的获取越来越方便,在保证数据质量的前提下,希望大家多做实验,多去发现规律。

13、指数化思维

13.jpg

指数化思维是指将衡量一个问题的多个因素分别量化后,组成一个综合指数(降维),来持续追踪的方式。把这个放在最后讨论,目的就是强调它的重要性。前文已经说过,许多管理者面临的问题是“数据太多,可用的太少”,这就需要“降维”,即要把多个指标压缩为单个指标。

指数化的好处非常明显:一是减少了指标,使得管理者精力更为集中;二是指数化的指标往往都提高了数据的信度和效度;三是指数能长期使用且便于理解。


内容转载:项目管理者联盟







返回