斯坦福 CS448B 16 可视化与自然语言处理
· 阅读时间约 3 分钟
TLDR
本文包含我对斯坦福 CS448B(数据可视化)课程的笔记,特别关注第十六讲关于可视化与自然语言处理的内容。我将讨论将文本与可视化链接的重要性、理解读者如何整合图表和标题、视觉问答以及自然语言界面。
原文
笔记
全球价值链贸易在 1990 年代迅速增长,但在 2008 年全球金融危机后陷入停滞
问题:1990 年至 2008 年期间,全球价值链份额上升了多少?
"文字和图像应该结合在一起。"
--塔夫特,1983
将文本与可视化链接
通过链接文本和表格促进文档阅读
--Kim等,2018
第 1 阶段:表格结构提取
第 2 阶段:将句子文本与表格单元格匹配
第 3 阶段:基于规则的匹配优化
流程评估
语料库
- Pew 研究报告
- ACL 和 CVPR 论文
- Kong 等(2014)
用户研究
假设:我们的界面有助于阅读包含表格的文档
受试者内设计研究
14 名成年志愿者,均为英语流利者
任务:用/不用我们的界面注释引用关系
理解读者如何整合图表和标题
读者是更依赖图表还是标题来获取要点?
当文本和可视化强调不匹配时,读者更依赖图表,可能会错过标题中的信息
视觉问答
预备性研究
解释描述了计算答案的过程
半数解释引用了图表的视觉特征
图表问答流程和生成解释
示例
用户研究
- 16 名参与者
- 20 组图表-问题-答案-解释组合(每种解释类型 5 个)