Stanford CS448B 15 Deconstructing Visualizations

August 28, 2022 · 5 min read

TLDR

This article contains my notes from Stanford's CS448B (Data Visualization) course, specifically focusing on the fifteenth lecture about deconstructing visualizations. I'll discuss the importance of classification, mark extraction, data extraction, and redesign.

Original

Notes

Forward Thinking

For the data explainer project, do we have to find one dataset and create our three visualizations off of that one dataset, or is it alright if we find a high-level topic that we are interested in, and create three visualizations within that topic but using separate datasets?
When using social network analysis, how do you validate your findings and/or determine if your findings are statistically significant? Is there an analogous "p value" standard for graph analysis? [Do you use qualitative or quantitative measures of validity?]
Why do we go for complex graphs if we can break down a complex concept into multiple, easily digestible graphs [e.g. broken down into strongly connected components]?
Wouldn't this also help with making the structure more intuitive?

Pixels are a poor representation of charts and graphs

Cannot index, search, manipulate or interact with the data

Goal: Reconstruct higher-level representation of charts and graphs that lets machines and people redesign, reuse and revitalize them

What is a good representation?

Approach

Classification: Determine chart type
Mark extraction: Retrieve graphical marks
Data extraction: Retrieve underlying data table

Classification

Training the Classifier

Method	Accuracy
[Prasad 2007] Multi-class SVM	84%
ReVision: Multi-class SVM	88%
ReVision: Binary SVM (yes/no per type)	96%

Corpus

Over 2500 labeled images and 10 chart types/ ReVision binary SVMs give 96% classification accuracy.

http://vis.berkeley.edu/papers/revision/

Stanford CS448B 15 Deconstructing Visualizations

Original

Notes

Forward Thinking

Classification

Training the Classifier

Corpus

Mark and Data Extraction

Redesign

Graphical Overlays

Interactive Documents

Automatic Redesign

Takeaways

Original​

Notes​

Forward Thinking​

Classification​

Training the Classifier​

Corpus​

Mark and Data Extraction​

Redesign​

Graphical Overlays​

Interactive Documents​

Automatic Redesign​

Takeaways​

Original

Notes

Forward Thinking

Classification

Training the Classifier

Corpus

Mark and Data Extraction

Redesign

Graphical Overlays

Interactive Documents

Automatic Redesign

Takeaways