10周入门数据分析丨如何炼就数据分析的思维?

面对数据异常,我们经常会出现“好像是A原因引起的?”“貌似和B原因也相关?”“有可能是C操作不当”的主观臆测。
或者,拿到一个分析议题,分析“11月销售数据下降的原因”,是先从产品层面,还是渠道层面着手的茫然无措。
显然,这样的思维是乱的。

十周入门数据分析.jpg

数据分析,首先你得具备看待一个事物的逻辑化思维,其次用数据去证明他。
我们会经常听说两种推理模式,一种是归纳,一种是演绎。这也是麦肯锡思维当中很经典的两个方法,工作中所有的问题,都可以用归纳或者演绎的形式进行拆分,我喜欢把这个过程称为“解构”。
这两种思维模式能够帮助数据分析师完成原始的业务逻辑积累,在此基础上快速定位业务问题,提升分析效率。

一、结构化思维

归纳其实就是把复杂问题分解成多种单一因素的过程,并且将这些因素加以归纳和整理,使之条理化、纲领化。这个过程犹如抽丝剥茧,将一团乱麻理地条条顺顺。

结构化思维.png

如何练习结构化思维,这其中会运用一个很重要工具,那就是金字塔模型。
根据《金字塔原理》,“任何事情都可以归纳出中心论点,由中心论点出发,可由三至七个论据支撑,每个一级论点可以衍生出其他的分论点。”如此发散开来,就可以形成以下的金字塔结构思考方式。

金字塔结构.png

但是在你还没有掌握这种结构化思维方式时,直接用这种思考方式是有一定难度的。这时候就可以采用金字塔原理中的MECE法则去思考结构。具体的操作方式是:

A. 尽可能列出所有思考的要点
B. 找出关系,进行分类。

他的原则是论点之间相互独立,不重叠;论据穷尽划分,不遗漏。

举个例子:

现在有一个线下销售的产品。我们发现8月的销售额度下降,和去年同比下降了20%。我想先观察时间趋势下的波动,看是突然暴跌还是逐渐下降。再按照不同地区的数据看一下差异,有没有地区性的因素影响。我也准备问几个销售员,看一下现在的市场环境怎么样,听说有几家竞争对手也缩水了,是不是这个原因。

用结构化思维梳理,就是:

结构化思维梳理.png

用这种方式思考,能确保思考的点成体系,逻辑严谨,要素相互之间不凌乱不打架,思考的点都穷尽。长期练习这种方法,不仅更容易找到逻辑结构,也更容易培养你的结构化思维。

推荐书籍:书籍:《金字塔思维》

二、假说演绎思维

以情况为起点的推理方法是归纳推理,以规则为起点的推理方法可以称之为演绎推理。

比如:

某自营电商网站,现在想将商品提价,让你分析下销售额会有怎样的变化?

首先可以确定销量会下降,那么下降多少?这里就要假设商品流量情况,提价后转化率的变化情况,然后根据历史数据汇总出销量下降的情况,从而得出销售额的变化情况。

假说演绎思维.png

  • 假设商品提价后,销量一定会下跌,问题是销量下跌多少?
  • 首先假设流量不会有变化,流量和渠道营销正相关,商品价格影响转化率,那么现在确定转化率的波动。
  • 找出平时的转化率(譬如为20%),预估提价后的转化率变化。假设各类型用户对价格敏感度不同,那么将用户划分忠诚XX、普通XX、羊毛XX..…
  • 不同用户层次数量不同,反应不同。忠诚用户转化率变化极低,羊毛几乎不会转化.…这些数据可以凭借经验做出假设,最后汇总。

具体的变化情况都可以根据过往的数据来拟合,统计学上也有一些科学的预测模型,后面讲数理统计知识时会有涉及。
假设先行就是以假设作为思考的起点,先提出问题,然后用MECE原则梳理关联因素间的结构关系。

小结

归纳和演绎的思维是数据分析初期必备的,面试考察逻辑思维也无非是这两点。实际情况中可针对不同的项目要求进行组合应用。在经过一定阶段的训练后,可以帮助提升业务熟悉程度,完成业务的初始积累后,后续的分析过程中就可以逐步减少拓展推理的层级及组合,逐步提升问题原因定位的效率。

三、指标化思维

上述的分析思维,帮助我们去定性问题,接下来我们要介入数据的方式,去定量分析。首要掌握指标化的思维。

假设有一家电商公司,我们想要了解网站运营的情况如何?运营人员向我们描述,我们的网站的流量很高啊,比淘宝差一点,比京东好一点,每天都有大量的新用户,老用户下单也很活跃啊。

我就疑惑了,流量高是多少?大量的新用户怎么衡量?一个手机注册了算新用户还是新下单的用户?下单活跃又是怎么个活跃法?
这样的问题相信只能凭运营人员的经验来判断,而经验带来的“后果”往往是拍脑袋式的决策。
如果用指标化的思维,应该用PV和UV去衡量流量,新用户下单数和占比去评价网站的拉新,新老买家占比等指标去衡量用户活跃。
很明显,指标就是用来定义、评价和衡量业务的一个标准。比如网站相关用户访问量、停留时长、跳出率等。销售相关销售量、销售额、客单价等。应该很好理解。
指标的设定有两个经验:

A.“有总比没有强”。对于要监控的事物,能有指标的尽量要有指标。
B.“一个好的指标应该是用来衡量具体且可量化的事物”。比如,用户访问量、停留时长、跳出率等。

下面这张图,解释了什么是指标化,这就是有无数据分析思维的差异,也是典型的数据化运营

指标化思维.png

指标体系

有指标是否就够了呢?指标按照结构化思维可以形成一个体系,如销售分析指标体系,生产指标体系,电商行业指标体系。
一家企业建立的数据分析体系通常细分到了具体可执行的部分,可以根据设定的某个指标异常变化,相应立即执行相应的方案,来保证运营的正常进行。
附上一张电商行业的指标体系,各运营模块的指标体系网上一搜一大把,可以参考着建立,后面我也会在我的文章里阐述。

建立指标体系的思路:

向上

可以按业务职能结构划分,映射出更多维度,比如渠道,运营,产品等相关模块,将相关指标映射到主要模块,通过简单快速的沟通,快速定位问题原因。

向下

可以按因果结构划分,也就是指标分解,利用公式的方法。比如营收=日活付费率arpu等指标因果关系进行划分,通过定位指标波动,定位最细指标,辅助维度下转,能够清楚的问题原因。
就像枝丫一样,从主干不断延伸,将业务用指标评价量化,逐渐形成一个健全的数据分析体系。

四、维度分析思维

最后,站在分析的角度讲一下维度思维。
当你有了指标,可以着手进行分析,数据分析大体可以分三类,第一类是利用维度分析数据,第二类是使用统计学知识如数据分布假设检验,最后一类是使用机器学习。这里我们主要了解维度分析法。
维度是观察数据的角度,例如“时间”、“地区”、“产品”。在具体分析中,我们可以把它认为是分析事物的角度。时间是一种角度、地区是一种角度,产品也是一种角度,所以它们都能算维度。
当我们有了维度后,就能够通过不同的维度组合,形成数据模型。数据模型不是一个高深的概念,它就是一个多维立方体。

这个概念最早来源于商业智能OLAP技术。数据按照事实表(Fact Table)和维表(Dimension Table)的形式存在。事实表用来记录具体事件,比如销量、销售额、售价、折扣等具体的数值信息。维度表是对事实表中事件的要素的描述信息,比如时间、城市、品牌、机型等。

维度分析思维.png

这是一个最简单的星形模型的实例。

事实表里面主要包含两方面的信息:维和度量。维的具体描述信息记录在维表,事实表中的维属性只是一个关联到维表的键,并不记录具体信息;度量一般都会记录事件的相应数值,比如这里的产品的销售数量、销售额等。维表中的信息一般是可以分层的,比如时间维的年月日、地域维的省市县等,这类分层的信息就是为了满足事实表中的度量可以在不同的粒度上完成聚合,比如2016年商品的销售额,来自上海市的销售额等。
下图举例一个简化的分析模型,分别由产品、城市、时间这三个维度组成,实际数据分析中,维度远不止三个。

维度分析模型.png

在数库中,可能是这样两张表:

维度表.png

我们可以将品牌作为维度,分析手机的销量情况,也可以将时间作为维度,分析每一年手机市场的份额情况。
多维分析操作包括:钻取(Drill-down)、上卷(Roll-up)、切片(Slice)、切块(Dice)以及旋转(Pivot)。
钻取(Drill-down):在维的不同层次间的变化,从上层降到下一层,或者说是将汇总数据拆分到更细节的数据,比如通过对2018年华为的总销售数据进行钻取来查看各个手机型号的销售数据。
上卷(Roll-up):钻取的逆操作,即从细粒度数据向高层的聚合。如将江苏省、上海市和浙江省的销售数据进行汇总来查看江浙沪地区的销售数据。
切片(Slice):选择维中特定的值进行分析,比如只选择苹果手机的销售数据,或2017年的手机销售数据。
切块(Dice):选择维中特定区间的数据进行分析,比如选择2016年2017年的销售数据。
旋转(Pivot):即维的位置的互换,就像是二维表的行列转换,如图中通过旋转实现产品维和地域维的互换。

为什么这边花那么多笔墨去讲维度和度量呢,一者是我们在梳理分析思路时,常常会按照几个大的维度类去划分层级,多面分析,如时间维、地域维、产品维,帮助我们成为“多面分析手”。另一方面,BI商业智能在操作也基于维度一说,熟悉维度和数据模型的原理,能更好的理解这个工具。(没错,这玩意儿后面要学)

为了更好的巩固,推荐大家去读《金字塔原理》,可以用思维导图的方式做好知识点整理,工具推荐Xmind和幕布。

作者丨启方
来源丨数据分析不是个事儿

专题文章

10周入门数据分析丨学习计划及大纲

> “我是文科生出身,可以学习数据分析吗?” > “我没有编程基础,可以成为数据分析师吗?” > “学习数据分析必须学习R和Python吗?” > …… 其实,数据分析没有想象中那么难,入....


10周入门数据分析丨如何炼就数据分析的思维?

面对数据异常,我们经常会出现“好像是A原因引起的?”“貌似和B原因也相关?”“有可能是C操作不当”的主观臆测。 或者,拿到一个分析议题,分析“11月销售数据下降的原因”,是先从产品层面,还是渠道层面....


10周入门数据分析丨数据分析惯用的5种思维方法

![十周入门数据分析.jpg][1] 在数据分析中,数据分析思维是框架式的指引,实际分析问题时还是需要很多“技巧工具”的。就好比中学里你要解一元二次方式,可以用公式法、配方法、直接开平方法、因式....


10周入门数据分析丨数据分析必备的43个Excel函数

Excel是我们工作中经常使用的一种工具,对于数据分析来说,这也是处理数据最基础的工具。很多传统行业的数据分析师甚至只要掌握Excel和SQL即可。 ![十周入门数据分析.jpg][1] ....


10周入门数据分析丨实操:如何用Excel做一次数据分析

前一篇分享了《[Excel数据分析必掌握的43个公式][1]》,今天这篇讲实操,教大家用Excel做一次简单的分析。一是让大家了解数据分析是一个怎样的流程;其次熟练Excel的操作(学的知识要用起来)....


10周入门数据分析丨写给新人的数据库入门指南

经常有刚从事数据分析的职场萌新,问我做数据分析工作要学些什么,应该怎样规划学习路径。我会告诉他:如果你Excel还用的不溜的话,就先学学Excel,当你用Excel处理和分析一些小数据集没有问题的时候....


10周入门数据分析丨零基础快速自学SQL,2天足矣

SQL全称是 Structured Query Language,翻译后就是结构化查询语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。 ![十周入门数据分析....


10周入门数据分析丨数据分析必掌握的统计学知识

统计学是数据分析的基石。学了统计学,你会发现很多时候的分析并不靠谱。比如很多人都喜欢用平均数去分析一个事物的结果,但是这往往是粗糙的,不准确的。如果学了统计学,那么我们就能以更多更科学的角度看待数据。....


10周入门数据分析丨不可不知的描述性统计

统计学需要掌握的知识,在数据分析过程中,广泛用于数据质量处理,分析模型构建以及数据挖掘。今天这篇文章将详细讲统计学中最基础的描述统计。 [10周入门数据分析][1] 试想,当你拿到一份数据....


10周入门数据分析丨概率分布,先懂这6个

![40207-7xao1g1bi2n.png](http://www.zuopm.com/usr/uploads/2021/01/3266240098.png) 本文重点介绍分析中常用的六个重....

本文来自投稿,不代表本站立场,如若转载,请注明出处:http://www.zuopm.com/data/380.html
-- 展开阅读全文 --
10周入门数据分析丨数据分析惯用的5种思维方法
« 上一篇 03-02
10周入门数据分析丨数据分析必备的43个Excel函数
下一篇 » 03-03

发表评论

作者信息

热门文章

标签TAG

热评文章