斯坦福 CS448B 05 二维空间
· 阅读时间约 9 分钟
TLDR
本文包含我对斯坦福 CS448B(数据可视化)课程的笔记,特别关注第五讲关于二维空间的内容。我将 讨论空间在数据可视化中的重要性、背后的原则,并探索各种数据可视化技术,包括使用指导元素、表达性、有效性、对比和模式感知的支持、数据分组和排序、数据转换、减少认知负担以及一致性。我还将介绍各种图表类型,如折线图、柱状图、堆叠面积图等,提供示例并讨论它们的设计考虑因素。
原文
笔记
课前思考
- 我们如何知道该使用哪种类型的可视化?是否有一些一般原则引导我们选择柱状图而非饼图?不同标记类型和视觉编码的心理学原理是什么?
- 是否存在一种标准/科学方法,图形设计师应该据此探索、迭代和最终完成他们的设计?
- 关于周三讲座中的社交网络图,包括节点-链接、链接排序矩阵和非排序矩阵视图,"是否有其他算法可以帮助突出数据中的特定模式?"
- 关于公开(Twitter)与私人(学术)数据可视化评论,以及人们在 COVID-19 疫情期间如何更加关注数据可视化:"读者的目标是否与设计 师的目标一致,如果不一致,这将如何影响用户获得的洞察力以及重新设计过程?
是否公平地只依靠专家?此外,作者如何向用户传达他们的目标?
图表和线条
填充空间
尽可能以最高分辨率显示数据
不用担心显示零点
在坐标轴刻度中包含零点?
坐标轴刻度选择
- 简洁性 - 数字是 10、5、2 的倍数
- 覆盖性 - 刻度接近数据的两端
- 密度 - 既不太多也不太少
- 可读性 - 空白、水平文字、大小
如何缩放坐标轴?
极端值解决方案
原始场景:
解决方案 1:裁剪异常值
注意最大的异常值没有显示
在实际任务中,异常值可能会以其他明显的方式标记。
解决方案 2:清晰标记刻度断点
解决方案 3:对数刻度
注释
在我看来,对数刻度是一种需要谨慎选择的解决极端值问题的选项,因为它减小了数据点之间的差异,导致用户对数据的敏感度降低。
两者都增加了视觉分辨率
- 对数刻度 - 便于比较所有数据
- 刻度断点 - 跨断点比较更加困难
线性刻度与对数刻度
对数刻度
对数将乘法转换为加法
log(xy) = log(x) + log(y)
对数刻度上的等距步长对应于乘法比例因子的等量变化
何时应用对数刻度?
-
解决数据偏斜(例如,长尾、异常值)
-
使跨多个数量级的比较成为可能
-
关注乘法因子(而非加法)
-
记住对数将 × 转换为+!
-
关注百分比变化,而非线性差异。
-
约束:正值,非零
-
约束:受众熟悉度?