從上述定義可以看出,大數據并不僅僅是數據本身,還包括大數據技術以及應用。從數據本身的角度出發,大數據是指大小、形態超出常規數據管理系統采集、存儲、管理和分析能力的規模較大的數據集,同時這些數據間存在著直接或間接的關聯,利用者通過大數據技術從而實現數據隱藏信息的挖掘和展示。根據來源的不同,大數據大致可分為以下3類:
(1)來源于人:人們在互聯網以及移動互聯網活動中所產生的文字、圖片、視頻等數據。
(2)來源于機器:以文件、數據庫、多媒體等形式存在的計算機信息系統產生的數據。
(3)來源于物聯網智能終端:隨著物聯網智能終端盼陜速部署,各類物聯網智能終端所采集的數據,包括智能攝像頭采集的視頻、車聯網產生的各種實時交通流量、各種可穿戴設備收集人體的各種健康指數監控等。
大數據技術包括數據采集、預處理、存儲、處理、分析和可視化,是將數據中的信息挖掘并展示的一系列技術和手段。
大數據應用則是對特定的大數據集,使用大數據技術和手段,實現有效信息的獲取過程。大數據技術研究的最終目標就是從規模龐大的數據集中發現新的模式與知識,從而挖掘到數據隱藏的有價值的新信息。