数据分析思维与实战(四)!

数据分析思维与实战(四)!

数据分析

  • 1、如何解决临时题述需求
  • 2、如何搞定BAT大厂的数据分析项目
    • 2.1 数据异常排查
  • 3、怎样才能更好地转型或成功跳槽
    • 3.1 对上节课三个问题进行解答
    • 3.2 日常工作分析
    • 3.3 转型四步法
  • 4、如何挑选适合项目场景的数据分析工具
    • 4.1 数据分析整体流程
    • 4.2 Excel常用操作
    • 4.3 SQL常用问题
    • 4.4 R语言以及python脚本案例
  • 5、多元思维模型:数据分析需要具备的四大能力
    • 5.1 背景
    • 5.2 中观能力
    • 5.3 微观能力
    • 5.4 宏观能力
  • 6、电商数据分析:京东App的详细产品分析
    • 6.1 如何看待京东App
    • 6.2 整体数据的分发效率
    • 6.3 漏斗分析
    • 6.4 新用户分析
  • 7、互联网金融:芝麻信用分的建模过程是怎么样的
    • 7.1 背景
    • 7.2 授信模型
    • 7.3 模型落地
  • 8、游戏:游戏行业的ROI和付费率是怎么算的
  • 9、销售:传统行业如何做好交易额提升
  • 10、指标体系搭建:指标体系的经典四步
    • 10.1 指标体系的定义以及选取原则
    • 10.2 建立指标体系的四个步骤
    • 10.3 知乎App指标体系实操
  • 11、流量分析:如何分析数据波动
    • 11.1 背景
    • 11.2 渠道分析
      • 1.常见渠道及渠道分类
      • 2.渠道推广的整个过程
      • 3.渠道的关键指标及分析方法
    • 11.3 转化与价值分析
      • 1.漏斗分析
      • 2.功能模块分析
    • 11.4 流量波动逻辑性分析
      • 1.日活
      • 2.留存
  • 12、路径分析:用户的使用路径网络分析
    • 12.1 路径分析定义
    • 12.2 路径分析案例——以美团APP为例
    • 12.3 路径分析思考
  • 13、竞品分析:教你如何做竞品分析
  • 14、营销活动:日常运营活动的分析模板
  • 15、用户增长:用户增长的本质是什么
    • 15.1、用户增长模型
    • 15.2、国内用户增长现状
    • 15.3、增长案例解析
  • 16、问题定义和拆解:如何去定义问题,拆解问题
  • 17、数据获取和分析:常见的SQL技巧和分析方法
    • 17.1数据获取前期准备
    • 17.2 SQL提数常见问题
    • 17.3 常用的分析方法
      • 1.结构分析
      • 2.对比分析
      • 3.时间序列分析
      • 4.相关性分析
      • 5.机器学习
    • 17.4、总结:
  • 18、报告撰写:专题报告的完美标准化格式
    • 18.1、报告撰写的原则
    • 18.2、报告的组成部分
    • 18.3、报告点评示例
  • 19、A/B测试:AB测试的效果监控
    • 19.1、A/B测试介绍
      • 概念
      • 整体流程
      • 常见的两种A/B测试类型
    • 19.2、A/B测试注意事项
    • 19.3、A/B测试案例
  • 20、行业分析:行业分析及框架分析
  • 21、数仓:数据仓库的三种类型表
  • 22、用户研究:用户研究和数据分析的根本联系和区别
  • 23、时间管理:优秀的数据分析师如何做时间管理
  • 24、结束语:数据分析师职场提升的关键点

 

16、问题定义和拆解:如何去定义问题,拆解问题

问题的基本结构

“问题”到底是什么?汉语的表述其实不太严谨。“问题”这个名词在我们生活中有很多种意思。比如:

  • 这个数据有问题;
  • 小明上班迟到了,因为路上出了点问题;
  • 小明在网课上问了老师一个问题。

这几个句子中的“问题”表述的不是同一个概念。

在英语环境下相对来说更容易区分,你搜索“问题”的英文翻译,有很多种,比如:question、problem、trouble、fault、matter 等。刚才的句子里对应的英文意思大概是这样的。

  • matter:这个数据有问题。
  • trouble、problem:小明上班迟到了,因为路上出了点问题
  • question:小明在网课上问了老师一个问题

当然这节课不是教你学英语的,我列举这些问题的解释是想先和你达成共识,避免我说的“问题”不是你理解的“问题”。比如:

  • 业务问题,是业务上的某个 Problem/Trouble,你可以理解为业务上遇到的困难、困境、难题;
  • 业务数据的分析问题(简称分析问题),是一个 Question,是一个问句。

这节课要解决的就是如何梳理业务数据分析问题,达成了共识,我们继续说梳理分析问题的框架。我认为提出一个完整的业务数据分析问题至少有两个部分:业务遇到的问题、分析的方向。

业务遇到的问题

业务遇到的问题一般就是**业务中现状和目标存在的差距,我们可以简称为业务问题。**我举几个数据分析中会遇到的场景做例子,看看什么是业务问题。

  • 案例 1:“App 新用户数在持续下降”

这是不是一个业务问题?你可能会想,新用户数下降,这肯定算问题吧?新用户数少了,日活肯定会受影响,而且说明产品的健康度不行,长期下去肯定是不行的。

一般情况下,新用户确实越多越好,但是如果这款 App 已经准备停止运营了呢?这种情况不是没有,很多公司内部会展开赛马机制,在同一领域做很多同类型的 App,最后集中资源扶持其中最好的一款 App。如果新用户下降的 App 是被淘汰的那款,目前已经放弃运营,一周后会关闭。那么新用户少了就少了,无所谓。甚至我们还会希望新用户数越少越好,最好这些新用户都去另一款成功的 App 上。

你看,我们的目标变了,看起来很严重的问题反而变得无关紧要。差距不成立,问题本身就不存在了,所以一个问题必须要有目标。

  • 案例 2:销售经理下达了本月的销售任务,每个销售员本月都必须完成 100 万的销售额。

这对于销售员小李来说,是不是一个问题?答案也是不一定。如果小李平时的销售额平均在每月 70 万左右,那么单月 100 万的销售额目标就是一个问题,所以小李必须想办法提升本月的销售额。那如果小李是金牌销售员,每个月随随便便就有 200 万的销售额,那达成 100 万销售额的目标就不是一个问题。

这个案例虽然有目标,但是没有说明现状,所以差距也不到一定成立,也就不一定是一个问题。

所以,业务问题至少要两个要素:**一个目标,以及和目标存在差距的现状。**如果把这两个案例转换成真正的问题将会是这样来描述。

  1. 目标是 App 每天新用户数 10 万人,但现在只有每天 2 万人。现状的 2 万人和目标的 10 万人之间存在 8 万人的差距。
  2. 目标是每月销售 100 万元,这个月预计只能完成 70 万。现状的 70 万和目标的 100 万之间相差 30 万。

上述的两个差距就是我们要解决的业务问题了,如果目标和现状之间没有差距,也就没有业务问题了。没有要解决的问题,也就没必要提出分析需求。

这里我也要提示你,在找出业务问题的阶段容易犯这么几种错误。

错误 1:把直觉当成了事实

我们一听到新用户下降,很自然地会认为这是一个问题。因为我们内心预设了一个标准,觉得考试那至少得及格,新用户那肯定是越多越好。不过这只是我们的预设立场,是我们过去的经验,不代表当下的事实。分析师的要求是严谨客观,所有的结论都要经得起逻辑的推敲。你直接预设一个立场,而不是依靠事实推理,就犯了主观判断的错误了。

错误 2:目标不是业务指标

我们的目标和现状都必须是一个业务指标。比如留存率、新用户数、转化率等等。当我们发现留存率没有达到目标,我们可以说这是一个业务问题。你不能说我的目标是想要知道某个数据,现状是没有数据,那这就变成取数需求了。我们要解决的是业务问题,不是业务方的问题。

错误 3 :目标和现状没有对应关系

另一个容易犯的错误就是目标和现状两者的指标不一致,没有对应关系。比如说,这样一个问题:“这个月要从外部获取 10 万的新用户,但这个月只有 10 万元的推广费用,怎么办?”

我们平时的表达很多都是这样的形式,这个问题虽然符合问题的基本结构,并且我相信大家能大概看懂是什么意思,但是这个问题的目标和现状的指标不直接相关。因为目标是获取新用户,而现状是推广费用。这两者中间还相差了一层逻辑,费用和新用户的关系是什么。

如果按照目标来解读,提问者实际想要表达的是:这个月要从外部获取 10 万的新用户,现有的推广资金预计只能达成 3 万新用户,怎么办?

如果按照现状来解读,也可以表达成:要达成获客目标需要 30 万的推广费用,这个月只有 10 万元的推广费用,怎么办?目标和现状的不匹配,会让问题变得模糊。

业务问题是引发我们提出分析问题的原因,但只有业务问题还不够完整。既然是问题,你总得“问”吧?即问题的第二个要素——分析的方向。

分析的方向

接下去我们要确定分析的方向,分析方向也就是你想要从哪些角度分析这个问题。

我们可以从很多维度分析一个业务问题,比如“哪些人”“什么时候”“是什么”“是多少”“为什么”“会怎样”“怎么办”等。

比如现在的业务问题是广告拉新的效果一直不及预期目标,对此你提出了这样一些分析方向。

  • 问题 1:有哪些好的广告拉新渠道?
  • 问题 2:有哪些拉新效果好的广告形式?
  • 问题 3:什么时段的广告投放效果比较好?

你还可以问其他的问题,比如拉新广告文案怎么写?拉新用户的男女比例分布怎么样?是不是三四线城市的点击率更高?等等。

虽然这些问题的结构都是完整的,有业务问题,也有分析方向。不过这不是一个好的业务数据分析问题,因为问题本身往往意味着答案

上面这些问题都会限制分析问题的方向,我们来看一下。

  • 问题 1:有哪些好的广告拉新渠道?

这个问题的答案是找到一些效果更好的渠道,然后在这个渠道上投放广告。

  • 问题 2:有哪些拉新效果好的广告形式?

这个问题的答案就变成如何优化拉新的广告形式。

  • 问题 3:什么时段的广告投放效果比较好?

这个问题的答案是找出投放效果好的时段,然后将资源倾斜到这些时段。

如果我们问的问题不正确的话,那答案也肯定不能解决业务问题。如果我们提出问题的目的是解决业务问题,那我们为什么不直接问“怎么办”呢。比如“广告拉新的效果一直不及预期目标,怎么办?”这个问题没有太多的限制,分析方向就很自由了。

  • 我们可以从投放的渠道分析:目前哪个渠道效果好?还有哪些类似的渠道?
  • 我们可以从广告优化分析:广告的文案怎么改?广告的素材怎么改?广告的形式怎么改?
  • 我们还可以从拉新成功的用户分析,看一下这些用户的特点是什么,如何触达同类型的其他人?

只问“怎么办”,我们的分析方向就会足够多,就很容易找到问题的突破口。所以这是一个强大的问题公式:业务现状+怎么办。

如果你之前经常觉得自己分析的时候没思路,有可能不是你的问题,而是提问者的问题。不过我们没办法要求提问的人都得学会这个方法,但至少你下次遇到类似问题的时候用问题公式这么改造一下,说不定思路一下子就打开了。

由于业务问题中的目标和现状的指标是对应的,并且“怎么办”这个分析方向是固定的,所以我们接下来要做的就是确定业务问题的指标。

确定业务问题的指标

我们可以根据指标的口径找到数据即可,所以这里我们可以分为两个步骤:确定指标、确定数据。

(1)确认指标

业务方提出的需求,往往是比较模糊的,比如“如何提升某功能新用户的人均使用次数”这个需求。这个问题中的要提升的指标是“某功能新用户的人均使用次数”,这个指标名字一听就很长,维度很多,我们需要先确认一下这个指标到底能不能用。

确认指标的过程,我们常常会遇到这样三类问题。

  • 指标不合理

我们制定的指标可能并不能很好地衡量我们的业务。案例里是想提升某功能的新用户的人均使用次数,那么为什么要用这个指标呢?如果是想衡量新用户对功能的忠诚度,用留存率是不是会更好呢?这个问题必须搞清楚,如果这个指标制定得不合理,那么后续的分析的基础就崩塌了,分析地再深入也没有意义。

  • 指标的口径不一致

指标的口径问题是一个做数据分析特别常见的问题。大家都在聊同一个指标,但可能每个人对这个指标的理解都不一样。

案例中的目标指标是某功能的新用户人均使用次数 5 次,这个里面有太多的口径需要确认了。比如新用户的口径。这可能是每个公司里面最混乱的一个口径了。我就遇到过在同一个业务线,新用户这个口径就有四、五种不同的理解。还有使用某功能,是按照进入页面算使用呢?还是必须完成一个特定动作算使用?人均使用次数是按平均数算还是中位数算?

这些口径必须提前确定清楚,只有大家把口径都统一了,后续的分析才能够继续。

  • 数据获取问题

由于数据采集的问题,不是所有的指标都能够获取到。有时候我们确定了口径,但是这个指标没办法获取到,那我们就只能用其他的指标来替代。

(2)确认数据

解决了以上的指标选择与口径的问题,第二步就可以确认每一个指标的具体数据了。

业务方提的需求往往比较主观,他只会告诉你,目标是提升某功能新用户的人均使用次数。那么到底提升到多少呢?这个目标一般业务人员自己是清楚的,因为业务部门在每个季度或者每个月都会制定一个业务目标。所以你可以与业务方沟通,直接拿来用就行。

如果业务部门没有具体的目标,那我们可以根据历史的数据趋势推断出来,或者拿历史的较大值出来做目标。而现状就比较好办了,只要口径是确定的,那么从数据库中获取这个数据就可以了。

经过数据分析师的改造,这个问题就变得非常清晰了。

目标:使用某功能的新用户的人均使用次数 5 次

现状:目前人均使用次数 3 次

分析方向:怎么办?

结语

一个完整的业务数据分析问题包括两个部分:业务遇到的问题和分析的方向,它是我们梳理问题逻辑时必须掌握的知识。了解问题的结构,我们就能将错综复杂的问题,用逻辑清晰的方式提炼出其本质,这对于我们理解业务、指导后续分析方向都有着非常重要的作用。

 

17、数据获取和分析:常见的SQL技巧和分析方法

17.1数据获取前期准备

一般在正式写SQL之前,要花1天时间做以下几件事:
1、了解清楚业务方和研发说的是哪张表、哪份日志
2、了解这些表和日志的筛选条件是什么,为什么要这么筛选
3、了解这些表和日志之前有什么坑,是不是哪天数据有缺失
4、验证现在是否有坑:select*,先跑一个核心数据看下

SQL提数常见问题
提数的最终目的就是为了分析
SQL提数看似很简单,但往往会因为其他事项而比较花时间:
1、被各种各样的其他事情打扰
2、遇到一些坑需要思考
3、突然找到一个新的点,就一直往下深挖
4、自己本身不会提数和分析,不知道如何看数据

时间管理上具体可以给你以下建议:
1、早上时间一定要利用好,早点到公司
因为下午大部分都有会,会议的时间也不太好控制,所以早上时间一定要利用好
2、提前了解好会议主题,不要别人拉你去参加一个会,你傻乎乎的直接去了 到了之后发现这个会议好像跟你没啥关系,然后走也不太好走,所以一定要先确定是否必须参加
3、中间所有进来的插队需求,先靠边站
4、利用晚上回家时间、周末时间在这件事上多下功夫,专注去做事
一旦专注之后,其实别人也不太好意思打扰你
踩坑之后,要总结,观人阅事

17.2 SQL提数常见问题

如果突然找到一个新的点,或者说突然很纠结某个点
一定要跳出小的圈子,最重要的事情是先把问题的拆解模块做完

1、先聚合再计算
如果要计算某个维度下的用数,不要直接icount (distinct imei)
而是Select city. count (1) as uv from( select city. imei. count( 1) from a group by city imei) group by city
2、一列变多行
Ab测试中会对一个用户打很多标签,而这些标签都是存在一个字段中,所以要看标签维度指标,就要对该字段进行列变行拆解
Select , b from tl Lateral view explode (a) table as b
3、取TOP
要看某分类下的top10消费額子分类(金額一致就并列)
Select, rank () over (partition by a order by b desc) as rank from table tl

17.3 常用的分析方法

1.结构分析

006fRELkly4h74x0oh51ej30i2063t8t

2.对比分析

所有的数据只有对比才有意义
实际工作中,最常见的对比对象就是大盘,比如新上线一个功能,怎么样评估这个功能效果?
除了看功能使用人数,更加要做的是这个功能的留存大盘的留存对比。

006fRELkly4h74x0q1c2tj30gz06zdgc

3.时间序列分析

一般看某指标时,都会把时序周期拉长,看数据趋势,而数据都是波动的,所以都会进行拆解分析,寻找具体波动项

4.相关性分析

5.机器学习

17.4、总结:

Who:指用户基础属性、用户画像
Where :渠道分析,渠道入口,用户从哪里来
when时间上的特征
What:用户使用了什么功能,哪些行为更加重要
Why:为什么要这么做,用户是主动还是被动做的
How:怎么做的,行为路径是什么

提数和分析完成之后,不要急着写报告
要先把一些关键数据和初步结论同步给业务方核心人员,约个时间一起看下 目的是看他们怎么理解这个数据有无明显问题
另一个是他们基于这些数据结论,准备怎么落地,需要他们提前想方案
在这个基础上,再去撰写报告。

18、报告撰写:专题报告的完美标准化格式

18.1、报告撰写的原则

报告撰写有很多原则,但这三个原则,如果你把握好了,基本上没什么问题
1.主题一脉相承分叉:只有一个主题,每页PPT都是围绕这个主题来分叉展开
2.通俗简单易懂:数据分析师的报告一定要简单易懂,文字要偏大白话
3.结论和闭环先行:要有分析结论,且落地性强

主题一脉相承分叉
常见两种问题
1、专题报告没有主题
通常在报告中,这里写点,那里写点。给别人看时,别人觉得有问题,但也说不上来 如果你写的报告没有主题,那肯定是因为你对专题报告的需求没理解到位
2、专题报告有主题,但是写的逻辑有点乱,这是因为本身思维不够严谨,受到的指导太少
解决办法:看别人报告是怎么写的,一页一页去斟酌

通俗简单易懂
数据分析师一定要让别人听明白你的报告
不管你是业务数据分析师,还是偏研发、偏算法的数据分析师,最终都是服务于业务 即使你不阐述PPT,也要保证业务方能看懂,否则就是给自己挖坑
一个数据分析专题报告,如果跟你最熟的业务方都理解不了,那对于其他人来说绝对是天书
解决办法:看产品经理日常怎么写报告

结论和闭环先行
PPT一定要有数据结论,以及在这个结论的基础上,业务方准备怎么做
注意这里是真的准备怎么做,而不是你给的建议怎么做
数据分析用来决策而不是建议,确实很多人写专题报告还没有达到这层面
解决办法:跟业务方多沟通数据结论,让他们给出落地项,而不是你建议怎么做

18.2、报告的组成部分

  • 标准化的专题报告包含哪几个部分呢?
  • 背景:为何要做这份专题报告,即问题的识别
  • 分析结论:如果是面向管理层的汇报,结论可以先行
  • 分析框架:即问题的拆解,往往这里不需要很细(思维导图)
  • 第一个关键点结论
  • 第一个关键点的支撑数据依次摆放
  • 第二个关键点结论
  • 第二个关键点的支撑数据依次摆放
  • 整体结论:这里把结论再汇总一次
  • 落地项:产品是怎么落地的,要非常具体(时间、人、预期效果)

如何衡量专题报告的价值。
在所有的数据结论和落地项当中,只要最后有1-2真正落地了,就非常有含金量。

18.3、报告点评示例

应该遵循结论和闭环先行原则:
基于什么数据
发现什么结论
基于这个结论的建议是什么
基于这个建议的产品落地项是什么

对于如何写好专题报告
建议你平时多看优秀的专题报告,重点是把自己带入到场景中 比如推给你一篇文章,你看的时候一定要把自己带入到场景当中去思考 思考文章作者说的到底有没有道理,思考作者的见解,文章的架构
每写一次专题分析,一定要获得他人的反馈

19、A/B测试:AB测试的效果监控

19.1、A/B测试介绍

概念

整体流程

A/B测试的整体流程一般是分为以下几步:
1.根据数据分析得到某建议项
2.有了建议项之后,产品经理直接就落地了吗?并没有,落地一般要通过A/B测试
3.根据某落地项,研发和设计人员进行开发设计(往往是先设计,然后再丢到A/B测试平台里面跑数据)
4.研发人员数据采集,这一步现在基本都是自动采集数据,所以一般不用管
5.分析师跟进A/B测试效果,当显著性在95%以上并且维持了一段时间,实验就可以结束

整体节奏要按照灰度、5%、10%、20%、50%、100%来控制
灰度通俗讲就是小版本
比如一个千万量级的Apple ,灰度代表5~10w这样的一个水平

常见的两种A/B测试类型

006fRELkly4h74x0s73qij30g4088dg5

实际工作中的问题
严格模式下,所有的专题报告落地项(除了明显的Bug修复和明显的用户体验)都要靠A/B测试展开
举个例子:
2个月前,产品上线了短视频功能
2个月后,大盘略涨(之前是略跌趋势)
短视频和非短视频的数据增加也明显
现在短视频业务方希望分析师能量化出——大盘的上涨主要是因为短视频带来的

19.2、A/B测试注意事项

站在数据分析师的角度去看,A/B测试时要注意以下事项:
1.A/B两个组是否真的相同
2.策略是否生效
3.A/B测试评估指标体系
4.多观察几天数据
5.A/B测试的存档规划——方便后续找增长点

站在数据分析师的角度去看,A/B测试时要注意以下事项:
1.A/B两个组是否真的相同
A:001 00 2003 004 005
B:001 002 003 004
C:001 002 003 004 006
D:X Y 001 002 003 004
A、B、C可做A/B测试
2.策略是否生效
工作中常见这种现象,产品经理根据分析师的专题报告落地项,然后进行某个A/B测试,研发也进行了A/B测试,最后发现效果不明显 此时所有人都觉得X优化项没用,也就没有多去做更多尝试。
数据分析师要对X进行测试,有没有明显问题。
3、A/B测试评估指标体系

006fRELkly4h74x0vb7vaj30i204gq31

4、多观察几天数据(4-10天)

006fRELkly4h74x0xtntmj30gs073t8s

5、A/B测试存档

006fRELkly4h74x0zxddej30i2047jrg

19.3、A/B测试案例

海报案例——不同地区爱点击的海报不同
广告位放哪更适合用户体验

案例思考
A/B测试涉及到设计师、产品经理、数据分析师三方
设计师:一定跳出传统的设计思维,在这个基础上,要多去看一些A/B测试增长黑客的书
产品经理:光凭直觉是不靠谱的,A/B猜测的闭环能够让我们去更好地理解用户
数据分析师:大多数改动都不会带来大幅效果的提升,A/B测试的效果往往都是略好,所以要持续迭代。如果出来上涨30%,观察是否数据出现错误。

 

学习资料见知识星球。

以上就是今天要分享的技巧,你学会了吗?若有什么问题,欢迎在下方留言。

快来试试吧,小琥 my21ke007。获取 1000个免费 Excel模板福利​​​​!

更多技巧, www.excelbook.cn

欢迎 加入 零售创新 知识星球,知识星球主要以数据分析、报告分享、数据工具讨论为主;

电商数据分析360°实战攻略!

你将获得:

1、价值上万元的专业的PPT报告模板。

2、专业案例分析和解读笔记。

3、实用的Excel、Word、PPT技巧。

4、VIP讨论群,共享资源。

5、优惠的会员商品。

6、一次付费只需99元,即可下载本站文章涉及的文件和软件。

 

文章版权声明 1、本网站名称:Excelbook
2、本站永久网址:http://www.excelbook.cn
3、本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长王小琥进行删除处理。
4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报。
6、本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。

THE END
分享
二维码
< <上一篇
下一篇>>