在Twitter匯集所有推文時,除推文本身外,也蒐集與推文者相關的metadata。換句話說,當一則140字元以內的推文產生時,Twitter所蒐集的資料,並非只有推文本身,還包含高達約31個不同的Data Fields(資料欄位)與metadata,而推文本身只佔單一推文資訊的不到十分之一,可見其記錄的資料內容之多樣性。這樣的資料結構,非常適用於巨量資料時代下的資訊分析型態,因為巨量資料分析認為所有資訊都是有價值且可用,可能具備看不見的價值,在未來將可能創造出不同的價值,因此所有資訊都需要被儲存與記錄下來,以便日後分析可用。
一、Twitter透過服務建構完整資料基礎
二、Twitter即時資訊處理技術-Storm與 Heron
三、結論-資料技術平台之快速建構應考量整合開放資料與雲端服務