二次表计算和帕累托图
什么是二次表计算?
首先顾名思义, 二次表计算就是在在第一次表计算的基础上再进行一次表计算, 之所以把这个二次表计算单独列出来一节课是因为这种计算比你想象当中要常用的多. 尤其是有一种图表Pareto Chart会用到二次表计算.
帕累托图长什么样?
左边的这个截图里我把三个计算放在一起, 清晰的展示原始数据,一次表计算和二次表计算. 下面正篇开始
第一列 Sales就是最原始的数据, 它并没有经过任何的表计算
第二列是Running Total Sales. 从第一行开始逐渐叠加
第三列就是我们的二次表计算了, 二次表计算是在一次表计算的基础上, 计算Percent of Total.
我们首先看第一行, 它原来的值是503,711 而后边的Percent Total是21.63% 这个21.63%是503,711 除以这个四个Region的Sales的总和: 503,171+691,828+391,722+739,814=2,326,534
⚠️注意: 这里的Total可不是第二列所有值的总和, 而是第一列中所有值的总和
换句话说, 这个total不是503,171 + 1,194,999 + 1,586,721 + 2,326,534
看出区别了么
二次表计算有什么用? 二八定理
二八定理也叫帕累托法则. 这个法则指出, 你80%的销售额可能是20%的顾客带来的. 这个社会80%的财富可能聚集在20%的人手里. 20%的员工完成了80%的工作. 80%的问题可能来自于20%的部分.
换句话说, 是少数人创造了多数的价值. 核心思想就是少部分关键因素导致了大部分结果.
那为了分析我们的数据中是否有这种现象我们就需要一种图表来观察我们的数据的分布是否像二八定理所说一样. 而这样的图表就是Pareto Chart 帕累托图
上边的这个截图清晰的展示了帕累托图. x轴代表不同的城市. 而Y轴代表累计的销售占比.
我们首先来看X轴上的第一个值, 是New York. 从柱状图中我们可以看到, 纽约的总Sales是$256,368. 而从折线图里我们可以看到的是, 纽约占据了整个销售额的11.02%
下边来到第二个城市Los Angeles. Los Angeles对的销售额排名第二, 总数为$175,751. 在折线图里, 它的数值是18.58%. 那么这个18.58%代表可不是洛杉矶的销售额占比, 它代表是洛杉矶加上纽约的总销售额占比.
换句话说, 排名第三Seattle上边的23.72%, 它所代表的是前三名加在一起总销售额占比. 那么从这个图里我们能看出什么?
我们的市场并没有被一个或者说几个客户垄断, 即使是前五大客户,它们占销售额的总比也才33.25%. 大概在三分之一左右. 但是这个情况并不一定适用于所有的公司. 有的制造业公司可能80%的利润都来自单一或者几个大的客户, 比如苹果的供应商可能80%的订单都来自于苹果. 那这种情况下, 就代表公司有过于依赖单一客服的风险
接下来我们来看另一张图:
这张图的x轴是产品的sub-category, 而y轴的Bar所代表的是这个subcategory所产生的利润. 如果我们从左往右看, 那么当subcategory来到Chairs椅子这个subcategory的时候, 我们就会发现整个椅子之前subcategory的总利润占比已经来到了80%.
换句话说: Copiers打印机, Phones电话, Accessories配件, Paper纸, Binders活页夹和Chairs椅子 一共贡献了超过80%的利润.
二次表计算在帕累托图中的应用
如果你看我们所做的这两个帕累托图的话, 你会发现这个图跟普通的Bar Chart唯一的区别就是它多了一个折线: Cumulative Profit/Total Profit.
这个折线就必须依赖二次表计算. 一次表计算是计算Running Total. 二次表计算是Percent of Total.
如何从一次表计算中创建二次表计算
当我们创建表计算的时候, 有些细心的同学可能已经注意到了这个选项. 在编辑表计算的这个页面最下边有一个叫做Add Secondary Calculation的选项. 如果你不选择, 默认这个选项没有开启的. 那么现在让我们打开这个选项
在我们选中之后, 我们的编辑页面会增加一个部分叫做Secondary Calculation Type
在这里我们会看到跟左边一模一样的选项, 但是不同的是, 它所进行的运算可不是复制前边的过程. 而是要进行一些不一样的运算. 比如如果你的Primary Calculation是Running Total. 那么你对的Seconardy Calculation的选项里就不能再进行Running Total了.
接下来, 我们把Secondary Calculation Type改成Percent of Total, 把计算方向改成Table(down). 我们就得到了一个纵向Parento图当中的那个曲线上的数值
从0到1完整的复刻 Profit By Subcategory的这个Pareto Chart.
一定会有小伙伴说: 老师老师, 那你能不能从头演示一下是怎么做出的这个Pareto Chart呢. 没问题安排
下边的这个动图里, 我从头开始展示了整个图表的创建过程. 它与表格唯一的区别就是这一次你的计算是以图表而非数字的形式展示出来了.
在创建帕累托图的时候要注意下边这几点.
- 我们的原始数据比如利润 一般通过Bar Chart来显示, 我们的二次表计算通过折线图来显示.
- 我们的二次表计算, 也就是Running Total/Total是通过折线图来显示
- 原始数据要从大到小排序. 因为我们主要关注的就是排名前几的占整个数据总量的多少
