跳至主要内容

斯坦福 CS448B 16 可视化与自然语言处理

· 阅读时间约 3 分钟

TLDR

本文包含我对斯坦福 CS448B(数据可视化)课程的笔记,特别关注第十六讲关于可视化与自然语言处理的内容。我将讨论将文本与可视化链接的重要性、理解读者如何整合图表和标题、视觉问答以及自然语言界面。

原文

下载 PDF.

笔记

全球价值链贸易在 1990 年代迅速增长,但在 2008 年全球金融危机后陷入停滞

问题:1990 年至 2008 年期间,全球价值链份额上升了多少?

"文字和图像应该结合在一起。"

--塔夫特,1983

将文本与可视化链接

通过链接文本和表格促进文档阅读

--Kim等,2018

第 1 阶段:表格结构提取

第 2 阶段:将句子文本与表格单元格匹配

第 3 阶段:基于规则的匹配优化

流程评估

语料库

  • Pew 研究报告
  • ACL 和 CVPR 论文
  • Kong 等(2014)

用户研究

假设:我们的界面有助于阅读包含表格的文档

受试者内设计研究
14 名成年志愿者,均为英语流利者
任务:用/不用我们的界面注释引用关系

理解读者如何整合图表和标题

读者是更依赖图表还是标题来获取要点?


当文本和可视化强调不匹配时,读者更依赖图表,可能会错过标题中的信息

视觉问答

预备性研究

解释描述了计算答案的过程
半数解释引用了图表的视觉特征

图表问答流程和生成解释

示例

用户研究

  • 16 名参与者
  • 20 组图表-问题-答案-解释组合(每种解释类型 5 个)

自然语言界面

下载 PDF

.