數位資料規模和可用性的不斷提高,為公共政策、科學發現、商業策略,甚至我們的個人生活提供了非凡的資源。然而,為了充分利用這些資料,使用者必須能夠理解它:追蹤問題、發現感興趣的模式,並識別(以及可能糾正)錯誤。與資料管理系統和統計演算法協同工作,分析需要針對領域特定意義的上下文人類判斷,例如資料中發現的集群、趨勢和離群值。
視覺化提供了一種理解資料的強大方法。透過將資料屬性映射到視覺屬性,例如位置、大小、形狀和顏色,視覺化設計師利用感知技能來幫助使用者辨別和解釋資料中的模式。11 然而,單一圖像通常最多只能回答少數幾個問題。相反,視覺分析通常在視圖建立、探索和精煉的迭代過程中進行。有意義的分析包括重複的探索,因為使用者會深入了解重要的關係、領域特定的上下文影響和因果模式。令人困惑的小工具、複雜的對話方塊、隱藏的操作、難以理解的顯示或緩慢的回應時間可能會限制所考慮主題的範圍和深度,並可能縮減徹底的思考並引入錯誤。為了達到最佳效果,視覺分析工具必須支援以與人類思維速度共鳴的速率流暢且彈性地使用視覺化。
本文的目標是協助設計師、研究人員、專業分析師、採購人員、教育工作者和學生評估和建立視覺分析工具。我們提出了一個互動動態的分類法,這些動態有助於成功的分析對話。該分類法包含12種任務類型,分為三個高階類別,如表1所示:(1)資料和視圖規範(視覺化、篩選、排序和衍生);(2)視圖操作(選擇、導航、協調和組織);以及(3)分析過程和出處(記錄、註釋、共享和引導)。這些類別包含實現迭代視覺分析的關鍵任務,包括視覺化建立、互動式查詢、多視圖協調、歷史記錄和協作。驗證和發展此分類法是一個社群專案,透過回饋、評論和精煉來進行。
我們對互動元素的關注預設了對視覺化設計的基本熟悉。長條圖、散佈圖、時間軸和節點連結圖的優缺點,以及構成這些圖形基礎的視覺編碼決策,當然是核心關注點,但我們在這裡將主要略過它們。許多文章和書籍詳細闡述了這些主題,11,12,16,52 我們向感興趣的讀者推薦它們。
在本文提出的分類法的每個分支中,我們都描述了展示有用互動技術的範例系統。需要明確的是,這些範例並不構成詳盡的調查;相反,每個範例都旨在傳達互動操作的性質和多樣性。在整篇文章中,術語分析師指的是使用視覺分析工具的人,而不是特定的人或角色。我們對分析師的概念涵蓋了任何尋求理解資料的人:調查金融市場或恐怖份子網路的傳統分析師、發現新見解的科學家、拼湊故事的記者,以及追蹤他們生活各個方面(包括血壓、支出、用電量或行駛里程)的人。
為了使分析師能夠探索涉及各種資料類型(例如,多變數、地理空間、文字、時間、網路)的大型資料集,彈性的視覺分析工具必須提供適當的控制,以指定感興趣的資料和視圖。這些控制使分析師能夠有選擇地視覺化資料,篩選掉不相關的資訊以專注於相關項目,以及排序資訊以揭示模式。分析師還需要從輸入資料中衍生新資料,例如標準化值、統計摘要和彙總。
視覺分析中最基本的操作可能是指定資料的視覺化:分析師必須指示要顯示哪些資料以及應如何描繪資料。從歷史上看,此過程需要特定視覺化元件的自訂程式設計。在使用者介面中,此類視覺化「小工具」通常以圖表類型呈現,這是一個可用視覺化範本(長條圖、散佈圖、地圖視圖等)的調色板,分析師可以將其資料插入其中。這種互動方法對於試算表程式的使用者來說會立即熟悉:使用者選擇圖表類型並將資料變數分配給視覺方面,例如 X/Y 軸以及視覺化標記的大小或顏色。圖表類型具有簡單性和熟悉性的優點,但它也限制了可能的視覺化類型,並且嘗試相同資料的不同視覺化會很麻煩。
一些視覺化系統設計師已經探索了其他方法。經典的科學視覺化系統1 和最近的藝術表達平台9 使用資料流程圖,其中視覺化過程被解構為一組更細粒度的運算子,用於資料匯入、轉換、佈局、著色等。分析師以互動方式將這些運算子鏈接在一起以建構新穎的顯示。透過運算子的彈性組合,資料流程模型可以實現更大的視覺化設計空間。然而,資料流程系統比圖表類型需要更多輸入工作,並且可能受到可用運算子集的限制。在許多情況下,新穎的設計需要具有程式設計專業知識的分析師來為系統開發新的建構模組。
其他系統基於用於視覺化建構的形式文法。這些文法構成了高階語言,用於簡潔地描述資料應如何映射到視覺特徵。透過組合少數這樣的陳述,分析師可以建構具有高度設計控制的複雜的自訂視覺化。許多流行的資料視覺化框架都使用這種方法,例如 Leland Wilkinson 的 圖形文法57、用於 R 統計分析平台的 ggplot256 和用於 HTML5 的 Protovis10。然而,這些框架中的每一個都至少需要最少的程式設計能力。
Tableau51(前身為 Polaris50)提供了一個透過拖放操作指定視覺化的範例:分析師將資料變數放置在對應於視覺編碼的「架子」上,例如空間位置、大小、形狀和顏色(參見圖 1)。然後,視覺規範被轉換為底層的形式文法,該文法確定視覺化設計和對資料庫的相應查詢。這種方法利用了形式文法的表現力,同時避免了程式設計的需要。另一個優點是形式文法可以透過自動化設計設施來擴充:系統可以從部分規範產生多個視覺化建議。37,38,44 雖然基於形式文法的系統既流暢又富有表現力,但使用者需要了解底層的生成模型,這比更熟悉的圖表類型增加了學習曲線。
幸運的是,這些方法並非互斥。分析師可以應用資料流程系統或形式文法來定義要包含在圖表類型中的新元件,從而利用前者的改進的表現力和後者的易用性。仍然需要用於視覺化規範的新穎介面。使用圖形標記(矩形、線條、繪圖符號等)作為其基本原語的形式文法提供了一個與互動式設計工具相容的概念模型。幾乎不需要程式設計的新工具可能會將自訂視覺化設計交到更廣泛的受眾手中。
資料值的篩選是視覺化過程固有的,因為分析師很少一次視覺化整個資料集。相反,他們為選定的資料維度建構各種視覺化。在給定選定維度的概述後,分析師通常希望在不同的資料子集中切換他們的焦點——例如,檢查不同的時間切片或隔離特定的值類別。
設計師設計了各種互動技術來限制顯示中的項目數量。分析師可以直接選擇(例如,「套索」)顯示中的項目,然後突出顯示或排除它們;我們稍後將討論這些直接視圖操作的形式。另一種選擇是使用一組輔助控制項或動態查詢小工具47 來控制項目可見性(參見圖 2、3 和 4)。適當小工具的選擇很大程度上取決於底層資料類型。分類或序數資料可以使用簡單的單選按鈕或核取方塊(當不同項目的數量很少時)或可捲動列表、層次結構和帶有自動完成功能的搜尋方塊(當不同項目的數量很大或包含任意文字時)進行篩選。序數、定量和時間資料也可以使用標準滑桿(用於單一閾值)或範圍滑桿(用於指定多個端點)進行篩選。當與視覺化的即時更新結合使用時,這些小工具允許快速且可逆地探索資料子集。在圖 2 中,Spotfire(左)提供了各種控制項來篩選視覺化資料:核取方塊和單選按鈕篩選分類變數,而範圍滑桿篩選數值;在右側,Google Hotel Search 提供了用於地理、日期和價格範圍的小工具。查詢控制項可以透過它們自己的視覺化進一步擴充:圖 3 顯示了一個範圍滑桿,該滑桿透過底層值的直方圖進行了擴充。
專家分析師還可以從更進階的功能中受益。例如,搜尋方塊可能支援複雜的查詢機制,複雜程度從簡單的關鍵字搜尋到正規表示式比對,再到完整的結構化查詢語言。雖然這些額外的機制可能不如圖形小工具那樣流暢地支援快速、增量探索,但它們提供了一種表達更細緻標準的方法。篩選還與其他操作互動:篩選小工具可以對以使用者指定方式排序的資料進行操作(參見下一節),或者使用者可以建立衍生值(參見下一節之後的章節)並根據結果進行篩選。
排序(或排序)是視覺化中的另一個基本操作。適當的排序可以有效地呈現趨勢和值集群5,或根據熟悉的分析單位(星期幾、財政季度等)組織資料。最常見的排序方法是根據一個或多個變數的值對記錄進行排序。排序控制項可以是工具列中的簡單選擇,也可以是表格標題上的點擊,以產生數值或文字值的升序或降序排序。有時,需要特殊的排序順序(例如工作日或月份名稱)才能揭示重要的模式。
在多視圖顯示的情況下,排序變得更加複雜,在這種情況下,可以對整個繪圖及其包含的值進行排序,以揭示模式或異常。跨繪圖一致地排序值(例如,按其邊際平均值或中位數值)可以揭示模式,同時促進繪圖之間的比較。
某些資料類型(例如,多變數表格、網路)並不總是適合按值進行簡單排序。此類資料可能需要更複雜的序列化方法20,57,58 ,這些方法嘗試最小化項目之間的距離度量。目標是揭示資料中的底層結構(例如,集群)。圖 5 顯示了一個範例,這是一個基於矩陣的社交網路視覺化。在左側,當按字母順序對行和列(代表人員)進行排序時,社交網路的矩陣圖幾乎沒有傳達任何結構。透過節點度以互動方式重新排序矩陣會揭示更多結構(中心)。透過網路連線對矩陣進行序列化會揭示社群的底層集群(右側)。
隨著分析在迭代週期中進行,使用者可能會發現輸入資料不足:可能需要轉換變數或從現有值衍生新屬性。常見的情況包括標準化或對數轉換,以實現更有效的值比較。衍生度量通常用於總結輸入資料,範圍從描述性統計(平均值、中位數、變異數)到模型擬合(迴歸曲線)和資料轉換(群組彙總,例如計數或總和)。雖然分析師可以在匯入資料進行視覺分析之前衍生新值,但在工具之間移動的開銷會阻礙流暢的迭代探索。因此,視覺分析工具應包括從輸入資料衍生新資料的功能。通常,此功能是透過計算語言提供的,該語言類似於試算表或資料庫查詢語言中找到的語言。除了這些基本功能之外,假設檢定方法(t 檢定、ANOVA)可以放大統計和視覺化平滑整合的好處。
改進的衍生方法為視覺分析研究提供了一個有希望的前沿。視覺工具如何支援彈性地建構更進階的模型或衍生值?使用示範程式設計方法,分析師可以註釋模式(例如,網路入侵事件60 的模式),系統可以從中概括模式辨識規則。或者,視覺工具可能會根據目前的視覺化狀態自動將適用的統計模型擬合到資料。例如,常見「樞紐」顯示中變數的巢狀結構可以映射到線性模型的結構。將視覺化與建模和預測相結合的更基於原則的框架仍在湧現。
一旦分析師透過資料和視圖規範操作建立視覺化,他們應該能夠操作視圖以突出顯示模式、調查假設並向下鑽取以取得更多詳細資訊。分析師必須能夠選擇項目或資料區域以突出顯示、篩選或對其進行操作。大型資訊空間可能需要分析師捲動、平移、縮放和以其他方式導航視圖,以檢查高階模式和細粒度詳細資訊。多個連結的視覺化通常比孤立的視圖更能清晰地洞察多維資料。分析工具必須能夠協調多個視圖,以便選擇和篩選操作一次應用於所有顯示,並組織產生的儀表板和工作空間。
指向感興趣的項目或區域在日常溝通中很常見,因為它指示了對話和動作的主題。在物理世界中,人們協調他們的手勢、目光和言語來指示顯著的項目。例如,不同的手勢可以傳達角度(定向平手)、高度(水平平手)、間隔(拇指和食指呈「C」形狀)、分組(圈出區域)和力(加速拳頭)。27 在視覺分析中,參考(或選擇)仍然至關重要,但它是透過更有限的動作集實現的,例如點擊或套索感興趣的項目。
視覺化中常見的選擇形式包括滑鼠懸停、滑鼠點擊、區域選擇(例如,矩形和橢圓形區域,或自由形式的「套索」)和區域游標(例如,「筆刷」4 或動態選擇器,例如氣泡游標18,它選擇目前最接近滑鼠指標的項目)。
這些選擇通常確定要操作的物件集,從而實現突出顯示、註釋、篩選或按需詳細資訊。請注意,互動式選擇與篩選密切相關:選擇可用於識別要從顯示中移除的項目。在選擇選擇方法時,還必須考慮互動的上下文。例如,當在平板電腦或手機上使用基於觸控的輸入時,回應懸停事件以提供按需詳細資訊是不合適的。
選擇在其表達能力方面也可能有所不同。大多數介面支援選擇項目集合。雖然這種方法易於實作,但它不允許分析師指定更高階的標準。一種更強大但更複雜的方法是支援將選擇作為對資料的查詢。22 維護查詢結構提高了視覺化應用程式的表達能力。例如,在圖表中繪製矩形可能指定對 X 軸和 Y 軸表示的資料變數的範圍查詢,而不是直接選擇包含的項目。然後可以儲存產生的選擇標準並應用於動態資料(更新的項目可能會進入或退出查詢區域)或完全不同的視覺化。範例包括在 TimeSearcher28 中查詢股價變動(參見圖 6)以及在平行座標顯示30 中查詢屬性範圍(圖 7)。在圖 6 中,角度選擇工具指定目標斜率(變化率)和一組股價的容差。選取所有在查詢時間範圍內具有相似斜率的時間序列;陰影區域顯示最小值和最大值的包絡線。小工具直接在視覺化上運作:從左向右拖曳小工具以互動方式查詢其他時間視窗。在圖 7 中,平行座標將多維資料繪製為平行軸之間的線段。在這裡,分析師已沿著軸拖曳以建立互動式選擇,從而突出顯示重量輕且里程高的汽車。
設計更具表現力的選擇方法仍然是一個活躍的研究領域。例如,研究人員已經提出了將滑鼠手勢映射到時間序列視覺化上的方法,以選擇感知上顯著的資料區域,例如峰值、谷值和斜率35(參見圖 8)或查詢複雜的時間變異模式。29 初始選擇也可以用作更複雜選擇的起點,因為分析師可能會點擊代表性物件,然後根據物件的屬性制定更廣泛的選擇(例如,「選擇所有像這個一樣藍色的項目」)。22 當然,選擇不一定僅限於滑鼠和鍵盤:觸控、手勢和語音等輸入模式可能會啟用新的、有效的選擇形式。
分析師如何導航視覺化部分取決於他們的起點。一種常見的導航模式遵循廣泛引用的視覺資訊搜尋格言:「先概述,再縮放和篩選,然後按需詳細資訊」。48 分析師可以首先對資料進行廣泛的查看,包括評估顯著的集群、離群值和潛在的資料品質問題。然後,可以對資料子集進行更具體、更詳細的調查,以跟隨這些定向操作。一個常見的範例是地理地圖:概述可能顯示整個區域,然後縮放到感興趣的區域。例如,圖 4 中的地圖描述了 2011 年 10 月最後一週晚上之後發生的犯罪活動,按時間和區域劃分。動態查詢小工具可以按一天中的時間(左側)、日期範圍(底部)和犯罪類型(右側)進行篩選。平移(拖曳)和縮放(按鈕和滾輪)控制項啟用視圖導航。當分析師放大地圖時,圓形犯罪標記會獲得詳細的標籤——一種語義縮放的形式。
當然,從廣泛的概述開始並不總是明智的。正在為即將到來的審判進行研究的法律分析師可能明智地放棄概述美國法院判決的整個歷史。相反,分析師可能會從與目前案件最相關的法律判決開始,這可能是由關鍵字搜尋確定的,並將調查擴展到其他被引用的判決。這種導航形式可以概括為「搜尋、顯示上下文、按需擴展」。53
在任何一種情況下,視覺化通常都充當資訊空間的視窗。分析師需要操作這些視窗來導航空間。常見的範例包括透過捲軸或滑鼠拖曳捲動或平移顯示,以及使用縮放滑桿或滾輪在不同層級之間縮放(圖 4)。縮放不一定遵循嚴格的幾何隱喻:語義縮放7 方法可以修改顯示的資訊量以及在分析師在詳細程度層級之間移動時資訊的顯示方式。在圖 9 中的日曆中,當分析師從月份導航到天再到小時時,顯示會放大選定的區域。語義縮放揭示了焦點區域內更多的詳細資訊。此外,動態查詢小工具,例如散佈圖的 X 軸和 Y 軸的範圍滑桿,可以篩選可見資料範圍,從而在圖表中提供一種縮放形式。
為了進一步協助導航,研究人員開發了各種焦點加上下文方法。這些「雙焦點」視圖49 提供了高關注度資料區域的詳細視圖,同時保留了周圍上下文以幫助分析師保持方向。第二個關鍵思想是使用概述和詳細資訊顯示。例如,地理視覺化可能包括一個大的放大地圖(詳細資訊),而一個較小的縮小地圖包括一個矩形,顯示放大視圖在更廣闊地形中的位置(概述)。在這種情況下,詳細資訊視圖提供焦點,而概述提供上下文。當縮放因子(概述與詳細資訊視圖的比率)為 5-20 時,效益最高。42 當需要更大的縮放因子時,中間概述也可能很有用。
另一種方法是使用失真或放大技術,這些技術轉換整個顯示區域,以便縮小上下文區域。一個簡單的範例是 Mac OS X dock,它使用 1D 魚眼失真來顯示常用應用程式;更複雜的方法在多個維度上使用失真。雖然複雜的失真方法通常在視覺上很有趣,但尚未證明它們在現實世界應用程式中的價值:觀看者可能會因非線性失真而迷失方向,與縮放等更簡單的方法相比,這些失真沒有顯示出顯著的效能改進。39
除了操作顯示空間之外,焦點加上下文方法還可以直接應用於資料本身。目標是識別哪些資料項目目前高度受關注(焦點),哪些資料項目無論目前的焦點如何都非常重要(上下文),以及哪些資料項目可以安全地從視圖中移除。DOI(興趣度)函數17,24,53 根據一般重要性(例如,層次結構中的頂層類別,或圖形中具有高中心性的節點)和目前的興趣(例如,由滑鼠點擊、搜尋查詢或靠近其他高興趣項目指示)計算資訊內容的分數。然後,DOI 分數的分佈可用於根據目前的視圖大小和互動上下文有選擇地控制項目的可見性,如圖 10 所示。當分析師點擊或搜尋不同的項目時,DOI 分數會動態更新以顯示相關的未見資料或隱藏不相關的詳細資訊。分析師目前興趣的模型會篩選顯示以顯示最相關的項目。低興趣項目被省略,但仍然可以透過彙總表示形式存取。興趣估計值會隨著分析師探索分類法而更新,從而啟動資料不同視圖之間的動畫轉換。
視覺化可以提供線索來協助分析師決定在何處以及如何導航。視圖操作的控制項通常是不可見的,例如透過滑鼠移動進行縮放/平移。改進的策略促進了分析師的發現,並在圖例或其他方式(例如捲軸位置)中提供設定的視覺指示,從而提供資訊豐富的回饋。一個重要的挑戰是顯示選定的項目,即使它們不在視圖中也是如此。例如,目前不在視圖中的文字搜尋結果可以透過捲軸61 或顯示周邊3,19 中的標記來顯示。
許多分析問題都需要協調的多個視圖,使分析師能夠從不同的角度查看他們的資料。研究教育程度的公共政策分析師可能會製作一個人年齡的長條圖、一個位置地圖、一個包含教育歷史的文字列表以及一個顯示收入與教育程度的散佈圖。透過在一個視圖中選擇單個項目或群組,分析師可能會在其他視圖中看到相關的詳細資訊或突出顯示的項目。這種探索多變數資料的強大方法還可以實現向下鑽取到子群組、標記集合和匯出選擇。
多視圖顯示可以促進比較。例如,Edward Tufte52 提倡使用小倍數:空間上鄰近放置且通常使用相同度量和比例的視覺化集合。如圖 11 所示,這些小倍數,也稱為網格圖,可以快速比較不同的資料維度或時間切片。視覺化顯示了明尼蘇達州各經濟部門的就業數字。圖表形式的重複支援各部門之間的比較。否則,在一個圖表中繪製所有資料會使個人趨勢變得混亂和模糊。在一個視圖中選擇時間點會突出顯示所有其他視圖中的相應點。
或者,多視圖顯示可以使用各種視覺化類型——例如直方圖、散佈圖、地圖或網路圖——來顯示多維資料集的不同投影。分析師在圖 12 中建構了一個複雜的相互連結的表格、繪圖和地圖拼湊而成,以分析密西根州的選舉結果。註釋指示選定的資料項目如何在視覺化視圖之間對應。隨附項目(例如圖例、直方圖滑桿和帶有突出顯示標記的捲軸)都可以提供資料的多個視圖。自動產生的圖例和軸對於為分析師提供準確的註釋以及在共享視覺化時提供有意義的解釋非常重要。圖例和軸也可以成為用於更改調色板、標記屬性、變數範圍或出處資訊的控制面板。43
多視圖顯示還可以實現跨視圖的互動式探索。筆刷和連結是在一個顯示中選擇(筆刷)項目以突出顯示(或隱藏)其他視圖中相應資料的過程。4 在圖 13 中,棒球分析師在一個繪圖中進行選擇,相應的項目在其他繪圖中突出顯示。在左側,選擇高收入球員(右上角繪圖)顯示對職業生涯長度或防守能力的依賴性很小,但與打擊表現相關。在右側,選擇助攻次數多於刺殺次數的球員集群(左中繪圖)揭示了對位置的強烈依賴性。因此,每個視覺化都可以充當輸入通道,以揭示跨資料集的模式。連結選擇透過允許分析師評估一個視圖中的模式如何投影到其他視圖上,從而實現豐富的多維推理。分析師可能希望以多種方式協調視圖:40,55 在一個視圖中選擇項目可能會突出顯示其他視圖中的匹配記錄,或者相反,提供篩選標準以從其他顯示中移除資訊。連結導航提供了另一種形式的協調:捲動或縮放一個視圖可以同時操作其他視圖。
雖然比較多個視覺化需要觀看者協調他們的注意力並在視圖之間在腦海中整合模式,但此過程通常比在單個視覺化中塞滿太多維度更有效。未來對分析師如何建構多視圖顯示和指定協調行為(例如,突出顯示、篩選)的研究可以為設計師提供有關如何建構更有效工具的理解。此外,如果設計師確保豐富的多視圖顯示保持可理解性,分析師更有可能產生引人入勝的見解。分析新手,甚至只是從咖啡休息後回來的經驗豐富的分析師,可能會對視圖的數量以及它們之間可能複雜的協調查詢集感到困惑。提供對協調設定的存取並重播視圖建構歷史記錄的視覺分析系統可以增強理解。
当分析师使用多个视图时,他们面临着管理可视化集合的相应挑战。与传统的基于窗口的界面一样,分析师可能希望打开、关闭、最大化和布局不同的组件。由于纯粹手动操作窗口可能很繁琐,设计良好的可视化分析工具可以简化可视化视图、图例和交互式控件的组织。例如,一个人力资源数据集可以显示薪资与工作年限的散点图,加上显示 10 个年龄组的条形图,以及包含七个公司站点(每个站点有 10-30 个职位)的树状图。这三个可视化图表可能会给散点图一个很大的区域,条形图和树状图在右侧上下堆叠。一个带有滑块、复选框、单选按钮和搜索框的控制面板可以位于最右侧,而一个按需详细信息窗口和注释框可以位于底部。这种平铺方法使拥有足够大显示器的分析师能够一次看到所有信息和选择器,最大限度地减少分散注意力的滚动或窗口操作,同时使他们能够专注于提取和报告见解。窗口之间的协调意味着滑块移动或复选框选择将导致所有视图更新,从而可以快速探索特定站点或特定职位的员工。
典型的系统允许分析师以对现有窗口组织进行适度更改的方式添加视图,例如第二个散点图。另一种方法是添加一个包含第二个散点图的新选项卡,以便分析师可以在第一组和第二组窗口之间切换。一个常见的功能是添加网格视图,这样可以一次创建多个可视化图表——例如,单独的条形图显示七个公司站点的每个站点的年龄分布。
更高级的系统可以通过自动化支持8来辅助此过程,该支持允许成组打开/关闭多个窗口并以有序方式布局它们。有用的方法包括标准散点图矩阵(显示所有散点图对)或自定义生成相关的感兴趣视图(例如,与可视化属性相关的数据变量的视图)。理想的功能是随着视图的添加或删除进行自动(重新)调整大小,以及将相关视图放置在空间邻近位置的布局例程。
随着更大和更多显示器变得越来越普遍,布局组织工具将成为创建有效用户体验的决定性因素。同样,对平板电脑和智能手机可视化的需求将促进布局组织方面的创新,使其更加紧凑,并且可以通过简单的手势重新配置。缩放、平移、翻转和排序策略也将改善分析师的体验,并有助于向他人进行有效的演示。
可视化分析不仅限于可视化的生成和操作,它还涉及迭代数据探索和解释的过程。因此,提供分析过程支架功能的可视化分析工具将被更广泛地采用。工具应通过记录分析师的操作和见解来保留分析溯源,以便可以回顾和改进工作历史。活动的文本日志具有优势,但活动的视觉概览可能更紧凑和易于理解。如果分析师可以*注释*模式、异常值和感兴趣的视图,他们可以记录他们的观察、问题和假设。在网络环境中,应授权分析师*共享*结果并与同事讨论、协调多个小组的工作或支持可能需要数周和数月的流程。此外,分析工具可以明确地*指导*新手完成常见的分析任务,为专家提供进度指示器,或引导观看者完成分析故事。
当使用可视化分析数据时,用户经常以迭代方式遍历视图空间。探索性分析可能会产生许多假设,从而导致多轮提问和解答。分析师可能会产生意想不到的问题,这些问题可能会立即进行调查或稍后重新访问。进行分析后,分析师可能需要审查、总结和交流他们的发现,通常以报告或演示文稿的形式。
为了支持迭代分析,可视化分析工具可以记录和可视化分析师的*交互* *历史记录*。至少,应用程序应提供基本的撤消和重做支持。虽然鼠标和键盘事件等底层输入很容易捕获,但当历史记录记录高级语义操作时,它们会变得更有价值。通过对用户操作空间(视图规范、排序、过滤、缩放等)进行建模,可以构建和可视化更丰富的日志。15,25,32,45 分析操作的常见视觉表示包括时间顺序(“时间线”)和顺序(“连环画”)视图。如图 14 所示,“连环画”显示追溯了业务运营数据可视化分析中采取的步骤。
视觉历史记录还揭示了分支历史记录的层次结构模式。以蛇形方式(先从左到右,再从右到左)读取图 15 中所示的图形,揭示了分析中迭代探索、分支和回溯的模式。“分块”相关操作的技术可以进一步减少混乱。25,36
视觉历史记录可以支持一系列交互。首先,历史记录提供了一种方便的机制,可以重新访问先前的分析状态并恢复未完成的探索。向状态添加元数据(例如注释、标签或评级)可以方便以后的审查和共享。交互式历史记录还可以捕获可重复的操作序列,这些操作序列可以命名并保存为可重用的宏。这项强大的功能使处理许多类似数据集的分析师能够自动化他们的工作。历史记录可能会刺激共享:分析师可以将选定的分析轨迹(从屏幕截图到交互式演示文稿)导出到外部媒体。最后,历史记录还提供了一种研究分析师和建模分析过程的方法。32,45
交互式可视化通常不仅充当数据探索工具,还充当记录、组织和交流探索过程中获得的见解的手段。一种选择是允许对视觉历史记录中的状态进行文本注释。通过与视图的直接交互,使用前面讨论的选择技术,可以实现更具表现力的注释。分析师可能希望“指向”可视化中的特定项目或区域,并将这些注释与解释性文本或指向其他视图的链接相关联。26
自由形式的*图形注释*提供了一种富有表现力的指向形式。26 在项目集群周围绘制一个圆圈或在图形中的峰值处指向一个箭头可以引导观看者的注意力。箭头的角度或颜色或手绘圆圈的形状可以传达情感线索或增加强调。图 16 的左侧显示了带注释的职业数据:顶部注释使用颜色编码的椭圆突出显示了银行出纳员中的性别逆转;底部注释表达了对宗教工作者不稳定百分比的困惑。尽管此类绘图允许高度表达,但它们缺乏与底层数据的明确联系。以矢量图形实现的自由形式注释可以持久存在于平移和缩放等几何变换中,但如果它们不是“*数据感知*”的,那么在面对过滤或聚合等操作时,它们可能会变得毫无意义。
当注释实现为选择时,可以使其成为数据感知的,如图 16 的右侧所示。在顶部图表中,选择查询锚定犯罪数据的注释。底部图表显示了在视觉编码更改时传输的注释:现在使用直方图滑块传达选定的地理范围。这些选择可以表示为一组选定项目、声明性查询或两者兼而有之。22 数据感知注释允许将指向意图重新应用于同一数据的不同视图,从而可以在不同视觉编码选择中重用引用。数据感知注释还可以使分析师能够搜索引用特定数据项的所有评论或可视化。由于数据感知注释是机器可读的,因此它们也可以用于导出选定的数据或聚合以识别高度关注的数据子集。
可视化分析研究人员通常关注单个分析师的感知和认知过程。在实践中,现实世界的分析也是一个社会过程,可能涉及多种解释、讨论和结果传播。26,54 其含义很明确:为了充分支持分析生命周期,可视化分析工具应支持社交互动。至少,工具必须能够导出视图(png、jpg、ppt 等)或数据子集(csv、json、xls 等),以便共享和重新访问。一个重要的功能是导出控制面板的设置,以便其他分析师可以看到相同的可视化。图 17 显示了 sense.us26,这是一个协作可视化分析工具的示例,该工具结合了视图共享、注释和讨论。该系统包括 (a) 交互式可视化,(b) 一组图形注释工具,(c) 保存视图的书签轨迹,(d) 用于添加评论的文本输入字段(书签可以拖到文本字段上以将视图链接到评论),(e) 附加到当前视图的文本评论,以及 (f) 一个可共享的 URL,该 URL 会随着可视化状态的变化而自动更新。
一种简单但有效的协作辅助方法是通过*应用程序书签*共享视图:可视化分析系统应能够建模和导出其内部状态。26,54 与静态屏幕截图不同,书签使分析师能够从协作者停止的地方继续进行探索。视图共享通常采用 URL 或类似标识符的形式,使协作者可以快速导航到感兴趣的视图。看到相同的视图为协作者提供了讨论的共同基础。注释方法可以应用于此类视图以进一步协作。有效视图共享的一个挑战是如何处理动态数据:书签视图应维护历史数据的快照、提供对最新数据的访问,还是两者兼而有之?
另一种共享和传播方法是*发布*可视化。Spotfire 和 Tableau 等商业工具可以将可视化仪表板发布为交互式网页。这些基于 Web 的组件提供交互式功能(例如,选择、搜索和向下钻取)的子集,以实现一定程度的后续分析。IBM 的 Many Eyes54 等服务可用于将可视化小程序嵌入到外部网站中。发布对于接触更广泛的受众尤其重要。虽然发布是广泛共享的必要条件,但它本身可能不足以吸引观众。21 嵌入在博客或论坛中的可视化可以接触到已建立的受众,并且可能比集中式站点更有效地促进讨论。13
其他协作问题取决于使用环境。协作者是*同步*(同一时间)工作还是*异步*(不同时间)工作?他们是*同地*(同一地点)还是分布式(不同地点)?这些配置中的每一种都可能需要专门的策略来控制访问、存在指示器和活动感知。21,26,31
对于某些传统领域,探索过程已得到很好的理解。例如,一个非常简单的工作流程可能是删除不完整的数据项、排序、选择高价值项目,并报告这些选择。然而,分析师可能需要开发新的策略,这些策略被正式化以指导新手并为专家提供进度指示器。可视化分析系统可以结合*引导式分析*,以引导分析师完成常见任务的工作流程。
有些过程显然是线性的,但许多可视化分析任务需要更丰富的*系统化但灵活*的过程,这些过程允许分析师在记录他们所做的事情的同时进行偏移。例如,SocialAction41 将社交网络分析组织成一系列活动(例如,节点排名、绘制节点、查找社区);该系统允许分析师有选择地跳过步骤,并记录已完成的步骤。在图 18 中,左侧面板建议了构建社交网络分析的常用步骤,并提供了进度指示器。
与此类似,专家经常开发由知识较少的团队成员使用的可视化,这与电子表格宏使专家能够为他人编码会计或业务实践的方式非常相似。需要进行更多研究,以确定有效的可视化分析过程,并使专家分析师能够创建可重用的工作流程。
近年来,记者们一直在尝试不同形式的*叙事可视化*46,通过构建交互式图形来讲述数据故事。《纽约时报》、《华盛顿邮报》、《卫报》和其他新闻来源的可视化通常通过支持文本和注释引导观看者逐步完成线性叙述。例如,在图 19 中,一个交互式图形使用分阶段和注释来引导读者了解数十年的预算预测。在故事结尾,此类可视化提供交互式控件以进行进一步探索。这些叙事结构既传达了来自数据的关键观察结果,又通过动画化故事的每个组成部分,巧妙地提供了可用交互的*隐式教程*。当演示文稿打开以进行自由形式探索时,观看者已经看到了交互式控件的演示。这些以及其他形式的叙事可视化展示了如何使用引导式分析向普通受众传播数据驱动的故事。
我们希望这个分类法和讨论将有助于在多个方面推进可视化分析。对于该领域的学生和新手,该分类法提供了一个定向的、高层次的介绍,介绍了成功可视化分析核心的交互式问题。我们鼓励感兴趣的读者查阅本文中引用的系统、书籍和研究论文,以更深入地了解这些问题。对于开发人员,该分类法可以充当创建新分析工具时要考虑的要素清单。对于研究人员,该分类法有助于突出需要进一步研究的关键领域,包括交互式视图规范的新方法、可视化和统计算法的更紧密集成、利用数据语义的选择和注释技术,以及引导式分析的有效方法。
当然,通过尝试提供一个领域的抽象图景,分类法可能是不完整的。在某些情况下,我们单独对密切相关的方面进行分类。启用数据规范的动态查询小部件通常用作视图导航的一种手段。选择技术对于有效的注释方案也至关重要。
在其他情况下,我们有选择地省略了一些材料。首先,我们没有深入探讨实现细节。支持实时交互通常需要仔细关注系统设计,特别是对于大型数据集。虽然 MapReduce14 等流行的大数据分析平台实现了足够的吞吐量,但它们的高延迟和缺乏在线处理限制了流畅的交互。真正交互式分析的需求对分析平台的设计者提出了重要的研究挑战,从低延迟架构到智能抽样和聚合方法。34
我们的分类法在讨论当前可视化分析研究的前沿方面也有些保守。例如,如何在可视化环境中最好地整合(半)自动化统计方法是一个核心挑战。我们对派生数据的讨论只是触及了表面。一个相关的担忧是*数据整理*的任务:33 重新格式化、清理和集成数据集,使其适用于可视化分析。不正确或结构不合理的数据会分散训练有素的分析师的注意力和精力,并对新手构成重大障碍。由于数据清理需要基于领域知识的细致入微的人工判断(“这个异常值是错误还是发现?”),因此数据整理是一个必然的交互过程,结合了统计方法、可视化和交互技术。这个主题值得比我们在紧凑的分类法中提供的更深入的处理。
这些问题代表了活跃的研究领域,我们预计我们对该领域的描述将在未来几年内不断发展。验证和发展这个框架是一个社区项目,可以通过可视化分析研究人员和从业人员的反馈、评论和改进来推进。我们邀请可视化、统计学、数据库和 HCI(人机交互)社区的见解和评论,并热切期待改进的工具能够不断涌现,以便理解我们周围丰富的数据。
我们感谢同事和学生对草稿提供了宝贵的意见:Maneesh Agrawala、Jason Chuang、Cody Dunne、John Guerra-Gomez、Pat Hanrahan、Sean Kandel、Diana MacLean 和 Kostas Pantazos。这项工作部分由美国国家科学基金会资助项目 IIS-0968521、IIS-1017745、CCF-0964173 和 SBE-0915645、美国国立卫生研究院-国家癌症研究所资助项目 RC1-CA147489 以及 ONC-SHARP 关于认知信息设计和可视化的资助项目支持。
1. Abram, G., Treinish, L. 1995. An extended data-flow architecture for data analysis and visualization. Proceedings of the IEEE Conference on Visualization: 263-270.
2. Ahlberg, C., Shneiderman, B. 1994. Visual information seeking: tight coupling of dynamic query filters with starfield displays. Proceedings of the Conference on Human Factors in Computing Systems: 313-317.
3. Baudisch, P., Rosenholtz, R. 2003. Halo: a technique for visualizing off-screen objects. Proceedings of the Conference on Human Factors in Computing Systems: 481-488; http://doi.acm.org/10.1145/642611.642695.
4. Becker, R. A., Cleveland, W. S. 1987. Brushing scatterplots. Technometrics 29(2): 127-142.
5. Becker, R. A., Cleveland, W. S., Shyu, M.-J. 1996. The visual design and control of trellis display. Journal of Computational and Graphical Statistics 5(2): 123-155.
6. Bederson, B. B., Clamage, A., Czerwinski, M. P., Robertson, G. G. 2004. DateLens: a fisheye calendar interface for PDAs. Transactions on Computer-Human Interaction 11(1): 90-119.
7. Bederson, B. B., Hollan, J. D. 1994. Pad++: a zooming graphical interface for exploring alternate interface physics. Proceedings of the Symposium on User Interface Software and Technology: 17-26; http://doi.acm.org/10.1145/192426.192435.
8. Bell, B. A., Feiner, S. K. 2000. Dynamic space management for user interfaces. Proceedings of the Symposium on User Interface Software and Technology: 239-248; http://doi.acm.org/10.1145/354401.354790.
9. Bestiario Impure; http://www.impure.com/.
10. Bostock, M., Heer, J. 2009. Protovis: a graphical toolkit for visualization. IEEE Transactions on Visualization and Computer Graphics 15(6): 1121-1128.
11. Card, S. K., Mackinlay, J., Shneiderman, B. 1999. Readings in Information Visualization: Using Vision to Think. Morgan Kaufmann.
12. Cleveland, W. S. 1994. The Elements of Graphing Data. Lafayette, IN: Hobart Press.
13. Danis, C. M., Viegas, F. B., Wattenberg, M., Kriss, J. 2008. Your place or mine?: visualization as a community component. Proceedings of the Conference on Human Factors in Computing Systems: 275-284; http://doi.acm.org/10.1145/1357054.1357102.
14. Dean, J., Ghemawat, S. 2004. MapReduce: simplified data processing on large clusters. Operating Systems Design and Implementation (OSDI): 137-150.
15. Derthick, M., Roth, S. F. 2001. Enhancing data exploration with a branching history of user operations. Knowledge Based Systems 14(1-2): 65-74.
16. Few, S. 2009. Now You See It: Simple Visualization Techniques for Quantitative Analysis. Berkeley, CA: Analytics Press.
17. Furnas, G. W. 2006. A fisheye follow-up: further reflections on focus + context. Proceedings of the Conference on Human Factors in Computing Systems: 999-1008; http://doi.acm.org/10.1145/1124772.1124921.
18. Grossman, T., Balakrishnan, R. 2005. The bubble cursor: enhancing target acquisition by dynamic resizing of the cursor's activation area. Proceedings of the Conference on Human Factors in Computing Systems: 281-290; http://doi.acm.org/10.1145/1054972.1055012.
19. Gustafson, S., Baudisch, P., Gutwin, C., Irani, P. 2008. Wedge: clutter-free visualization of off-screen locations. Proceedings of the Conference on Human Factors in Computing Systems: 787-796; http://doi.acm.org/10.1145/1357054.1357179.
20. Hahsler, M., Hornik, K., Buchta, C. 2008. Getting things in order: an introduction to the R Package seriation. Journal of Statistical Software 25 (3): 1-34; http://www.jstatsoft.org/v25/i03.
21. Heer, J., Agrawala, M. 2008. Design considerations for collaborative visual analytics. Information Visualization 7(1): 49-62.
22. Heer, J., Agrawala, M., Willett, W. 2008. Generalized selection via interactive query relaxation. Proceedings of the Conference on Human Factors in Computing Systems: 959-968.
23. Heer, J., Bostock, M., Ogievetsky, V. 2010. A tour through the visualization zoo. Communications of the 53(6): 59-67; http://doi.acm.org/10.1145/1743546.1743567.
24. Heer, J., Card, S. K. 2004. DOITrees revisited: scalable, space-constrained visualization of hierarchical data. Proceedings of Advanced Visual Interfaces: 421-424; http://doi.acm.org/10.1145/989863.989941.
25. Heer, J., Mackinlay, J., Stolte, C., Agrawala, M. 2008. Graphical histories for visualization: supporting analysis, communication, and evaluation. IEEE Transactions on Visualization and Computer Graphics 14(6): 1189-1196; http://portal.acm.org/citation.cfm?id=1477066.1477414.
26. Heer, J., Viégas, F. B., Wattenberg, M. 2009. Voyager and voyeurs: supporting asynchronous collaborative information visualization. Communications of the 52(1): 87-97; http://doi.acm.org/10.1145/1435417.1435439.
27. Hill, W. C., Hollan, J. D., 1991. Deixis and the future of visualization excellence. Proceedings of the IEEE Conference on Visualization: 314-320; http://portal.acm.org/citation.cfm?id=949607.949659.
28. Hochheiser, H., Shneiderman, B. 2004. Dynamic query tools for time series data sets: Timebox widgets for interactive exploration. Information Visualization 3(1): 1-18.
29. Holz, C., Feiner, S. 2009. Relaxed selection techniques for querying time-series graphs. Proceedings of the Symposium on User Interface Software and Technology: 213-222; http://doi.acm.org/10.1145/1622176.1622217.
30. Inselberg, A., Dimsdale, B. 1990. Parallel coordinates: a tool for visualizing multi-dimensional geometry. Proceedings of the IEEE Conference on Visualization: 361-378.
31. Isenberg, P., Tang, A., Carpendale, S. 2008. An exploratory study of visual information analysis. Proceedings of the Conference on Human Factors in Computing Systems: 1217-1226; http://doi.acm.org/10.1145/1357054.1357245.
32. Jankun-Kelly, T. J., Ma, K.-L., Gertz, M. 2007. A model and framework for visualization exploration. IEEE Transactions on Visualization and Computer Graphics 13(2): 357-369; http://dx.doi.org/10.1109/TVCG.2007.28.
33. Kandel, S., Heer, J., C. Plaisant, C., Kennedy, J., van Ham, F., Henry-Riche, N., Weaver, C., Lee, B., Brodbeck, D., Buono, P. 2011. Research directions for data wrangling: visualizations and transformations for usable and credible data. Information Visualization.
34. Keim, D. A., Mansmann, F., Schneidewind, J., Ziegler, H. 2006. Challenges in visual data analysis. Information Visualization: 9-16.
35. Kong, N., Agrawala, M. 2009. Perceptual interpretation of ink annotations on line charts. Proceedings of the Symposium on User Interface Software and Technology: 233-236; http://doi.acm.org/10.1145/1622176.1622219.
36. Kurlander, D., Feiner, S. 1988. Editable graphical histories. Proceedings of the IEEE Workshop on Visual Language: 127-134.
37. Mackinlay, J. D. 1986. Automating the design of graphical presentations of relational information. Transactions on Graphics 5(2): 110-141; http://doi.acm.org/10.1145/22949.22950.
38. Mackinlay, J. D., Hanrahan, P., Stolte, C. 2007. Show me: automatic presentation for visual analysis. IEEE Transactions on Visualization and Computer Graphics 6: 1137-1144.
39. Nekrasovski, D., Bodnar, A., McGrenere, J., Guimbretière, F., Munzner, T. 2006. An evaluation of pan and zoom and rubber sheet navigation with and without an overview. Proceedings of the Conference on Human Factors in Compuing Systems: 11-20; http://doi.acm.org/10.1145/1124772.1124775.
40. North, C., Shneiderman, B. 2000. Snap-together visualization: a user interface for coordinating visualizations via relational schemata. Proceedings of Advanced Visual Interfaces: 128-135; http://doi.acm.org/10.1145/345513.345282.
41. Perer, A., Shneiderman, B. 2008. Systematic yet flexible discovery: guiding domain experts through exploratory data analysis. Proceedings of Intelligent User Interfaces: 109-118; http://doi.acm.org/10.1145/1378773.1378788.
42. Plaisant, C., Carr, C., Shneiderman, B. 1995. Image-browser taxonomy and guidelines for designers. IEEE Software 12(2): 21-32.
43. Riche, N. H., Lee, B., Plaisant, C. 2010. Understanding interactive legends: a comparative evaluation with standard widgets. Computer Graphics Forum 29(3): 1193-1202.
44. Roth, S. F., Mattis, J. 1991. Automating the presentation of information. Proceedings of the IEEE Conference on Artificial Intelligence Applications: 90-97.
45. Scheidegger, C., Koop, D., Santos, E., Vo, H., Callahan, S., Freire, J., Silva, C. 2008. Tackling the Provenance Challenge One Layer at a Time. Concurrency and Computation: Practice and Experience 20(5): 473-483; http://portal.acm.org/citation.cfm?id=1350745.1350757.
46. Segel, E., Heer, J. 2010. Narrative visualization: telling stories with data. IEEE Transactions on Visualization and Computer Graphics 16(6): 1139-1148.
47. Shneiderman, B. 1994. Dynamic queries for visual information seeking. IEEE Software 11(6): 70-77.
48. Shneiderman, B. 1996. The eyes have it: a task by data type taxonomy for information visualizations. Proceedings of the IEEE Symposium on Visual Languages; http://portal.acm.org/citation.cfm?id=832277.834354.
49. Spence, R., Apperley, M. 1982. Data base navigation: an office environment for the professional. Behaviour and Information Technology 1(1): 43-54.
50. Stolte, C. Tang, D., Hanrahan, P. 2002. Polaris: a system for query, analysis, and visualization of multidimensional relational databases. IEEE Transactions on Visualization and Computer Graphics 8: 52-65.
51. Tableau Software; http://tableausoftware.com.
52. Tufte, E. 1983. The Visual Display of Quantitative Information. Cheshire, CT: Graphics Press.
53. van Ham, F., Perer, A. 2009. Search, show context, expand on demand: supporting large graph exploration with degree-of-interest. IEEE Transactions on Visualization and Computer Graphics 15(6): 953-960; http://dx.doi.org/10.1109/TVCG.2009.108.
54. Viégas, F. B., Wattenberg, M., van Ham, F., Kriss, J., McKeon, M. 2007. Many Eyes: a site for visualization at Internet scale. IEEE Transactions on Visualization and Computer Graphics 13(6): 1121-1128.
55. Weaver, C. E.. 2004. Building highly-coordinated visualizations in Improvise. Proceedings of the IEEE Information Visualization Conference: 159-166.
56. Wickham, H. 2009. ggplot2: Elegant Graphics for Data Analysis. Springer.
57. Wilkinson, L. 2005. The Grammar of Graphics (Statistics and Computing). Secaucus, NJ: Springer-Verlag.
58. Wilkinson, L., Friendly, M. 2009. The history of the cluster heat map. The American Statistician 63(2): 179-184.
59. Willett, W., Heer, J., Agrawala, M. 2007. 气味小部件:通过嵌入式可视化改进导航提示。 IEEE Transactions on Visualization and Computer Graphics 13(6): 1129-1136; http://dx.doi.org/10.1109/TVCG.2007.70589。
60. Xiao, L., Gerth, J., Hanrahan, P. 2006. 使用知识表示增强网络流量的可视化分析. Proceedings of the IEEE Conference on Visual Analytics Science and Technology: 107-114。
61. Zellweger, P. T., Mackinlay, J. D., Good, L., Stefik, M., Baudisch, P. 2003. 城市之光:最小空间中的上下文视图。 Extended Abstracts of the Conference on Human Factors in Computing Systems: 838-839; http://doi.acm.org/10.1145/765891.766022。
喜欢还是讨厌?请告诉我们
Jeffrey Heer ([email protected]) 是斯坦福大学计算机科学助理教授,他的研究方向是人机交互、可视化和社会计算。2009年,他被《麻省理工科技评论》评为TR35(35位35岁以下的创新者)。他拥有加州大学伯克利分校计算机科学学士、硕士和博士学位。
Ben Shneiderman ([email protected]) 是马里兰大学帕克分校计算机科学系教授、人机交互实验室的创始主任,以及高级计算机研究所的成员。他于1997年当选为会士,并于2001年当选为美国科学促进会会士。他于2001年获得 SIGCHI终身成就奖。他是美国国家工程院院士。
© 2012 1542-7730/12/0200 $10.00
最初发表于《Queue》杂志第10卷第2期—
在数字图书馆中评论这篇文章
David Crandall, Noah Snavely - 使用互联网照片集建模人物和地点
本文介绍了我们使用在线照片集在全球和本地范围内重建关于世界及其居住者的信息的工作。这项工作得益于社交内容共享网站的迅猛发展,这些网站创建了庞大的用户生成视觉数据在线集合。仅Flickr.com目前就托管着超过60亿张由超过4000万独立用户拍摄的图像,而Facebook.com表示其每天增长近2.5亿张照片。
Robert DeLine, Gina Venolia, Kael Rowan - 使用代码地图进行软件开发
为了更好地理解专业软件开发人员如何使用代码的可视化表示,我们采访了微软的九位开发人员,以确定常见的场景,然后调查了400多位开发人员,以更深入地了解这些场景。
Brendan Gregg - 可视化系统延迟
当 I/O 延迟以可视化热图的形式呈现时,会出现一些有趣而美丽的模式。这些模式提供了关于系统实际运行情况以及最终用户应用程序体验到的延迟类型的见解。在这些模式中看到的许多特征仍然不被理解,但到目前为止,它们的分析揭示了以前未知的系统行为。
Jeffrey Heer, Michael Bostock, Vadim Ogievetsky - 参观可视化动物园
得益于传感、网络和数据管理方面的进步,我们的社会正以惊人的速度产生数字信息。据估计,仅在2010年,我们将生成1,200艾字节——相当于美国国会图书馆内容量的6000万倍。在这数据洪流中蕴藏着关于我们如何开展业务、政府和个人生活的丰富有价值的信息。为了充分利用这些信息,我们必须找到有意义地探索、关联和交流数据的方法。