“Explain the default aggregation for measures”— Desktop Specialist Exam Guide 4.3.2
理解Measure的自动聚合
在你刚接触Tableau的第一次操作, 可能不经意间聚合就发生了一次.
在左边的这个截图里你可以看到, 当我们把sales从左边拖拽到Text Mark上时, Sales前边出现了一个SUM()函数
这个结果告诉我们一个重要的事实:
聚合在Tableau中是默认开启的. 这是一个非常重要的信息. 你所看到的可不是原始数据, 而是所有数据聚合之后的结果.
由于这个默认的设定,你就要意识到, 你如果你想要展示单独每一行的数据, 你需要要关掉聚合.
理解Dimension的自动聚合
接下来我们再来看一个更隐蔽的. Dimension的自动聚合
我们接下来看左边这个截图. 当我们把Customer Name从左侧拖拽到右侧的时候. 我们会发现所有的名字都按照Alphabeta从A到Z排列了对吧.
接下来思考这么几个问题.
在我们当前的这个名字的列表里, Aaron Bergman出现了几次?
在数据当中的column [Customer Name]中 Aaron Bergman又出现了几次, 或者说有几行?
那每个名字如果在数据中不止一行, 现在变成了一行, 是不是发生了某种聚合?
这就到了另一个更深入的问题了, 如果没聚合的话, 会变成什么样呢?
如何关闭自动聚合?
在Tableau中, 自动聚合是可以关闭的. 这个选项在最上边的菜单栏Analysis当中.
记住这个重要的选项. 很多时候有一些图你怎么都做不出来很可能就是因为这个选项.
如果没有自动聚合, 我们的图表会变成什么样?
接下来请认真的看下边的动图. 我将在这个动图里清晰的展示开启自动聚合和关闭自动聚合的巨大差别

在关闭了自动聚合之后, 图表为什么变成了这样?
在动图里我们可以看到, 在开启之前, Aaron Bergman后边显示的是他的Total Sales: $886. 但是当自动聚合关闭之后, 整个表格发生了巨大的变化, 在Aaron Bergman名字的后边所显示的是具体每一列的数据
在左边这个截图中我们可以清晰的看到出现在Aaron Bergman后边的六个数字分别是这个客户的六行数据中Sales的数值
Aaron Bergman一共下了三个订单, 这三个订单里包含六个产品. 这六个数字就是这六个产品的销售额
接下来我们看看如果我们关闭Dimension的Auto Aggregation会发生什么

首先我把所有的customer name 都拖拽到text mark上. 这时候在Tableau中会出现所有customer的名字. 但是这个时候每个名字都只会出现一次. 接下来我们把Aggregate Measures这个选项关闭, 你会发现跟Measure那边相似, 在User Name这里, Aaron Bergman同样出现了六次. 这是因为在数据当中, 我们[customer name]里 Aaron Bergman一共占了六行, Tableau把每一行的Aaron Bergman都显示出来了
自动聚合对散点图的巨大影响
自动聚合这个选项对于绝大多数类型的图表都是必需的, 但是对于一小部分类型的图表来说, 开启和关闭就完全是两个图了. 散点图就是一个最典型的例子. 请认真观察下边的这个动图.

在上边的这个动图中, 我创建了关于Aaron Bergman一个人的散点图. 当自动聚合开启的时候, x轴显示的是其实SUM(Quantity) y轴显示的是SUM(Sales). 这两者都是已经聚合过的. 由于Aaron的六行数据已经在这个时候被聚合在一起了, 所以不管在x轴还是在y轴上, 它都只有一个值, 因此在散点图上,也就只有一个点
当自动聚合这个选项关闭之后, 情况发生了变化. 由于Aaron一共有六行数据, 而每一行数据都有一个不一样的Quantity和Sales, 所以在自动聚合关闭之后, 原来的一个点变成了六个.
关闭自动聚合的另一重要用途: 下钻 Drill Down
基于前一节部分的对比, 我们就可以利用自动聚合的开关来做两个图, 并且把这两个图来放在一起比较. 请观察下边这个动图, 并且在你的Tableau上一比一复制出来.

左边的这个图展示的每个消费者它的消费总和和购买数量的总和. 每一个点代表一个消费者. 而右边的这个散点图是每个产品代表一个点. 当我们点击左侧的一个点, 那么右侧的散点图就会被过滤, 它会只显示你选中的那个消费者的每一个产品. 左右两个图本质上是完全一模一样的. 而唯一的区别就是左边是Aggregation开启, 右侧是关闭的. 仅此而已.
在aggregation关闭的情况下, 你可以更清楚的看到数据原来的情况. 具体每一行都是什么产品, 多少钱, 买了多少.
这种从数据颗粒度粗到数据颗粒度高细的情况就是下钻了.