Web 2.0的發展,讓網路以使用者為內容製造中心,形成社群網路、部落格、論壇網站的蓬勃發展。再加上行動裝置的普及,讓網路資訊的製造不因時間地點受限。簡單來說,上FB發文不再是下班回到家開電腦才能做的事,而是隨時隨地想做就可以做的。使用者與網路不受時間限制的持續互動,形成資訊量的爆炸性成長。企業開始渴望尋找蘊藏在這龐大數據中的商機,便逐漸形成現今銳不可擋的Big Data風潮。
什麼是Big Data呢?
Big Data,又稱巨量資料、海量資料,指的是在合理的時間內對大量的資料進行擷取、整理、分析並整合成有用的資訊情報。
Big Data有三項特性(3個V-Volume、Velocity、Variety)
Volume:
巨量。數據量的大小是相對的,並無一絕對值來界定。根據維基百科,截至2012年,單一資料集數據大小約在1TB~100PB之間。一般來說,只要到達PB等級,就常被稱為Big Data。 (註:1TB=1024GB, 1PB=1024TB)
Variety:
多樣性。指的是資料的形態,包含結構化與非結構化資料兩大類。Big Data有很大注目焦點在從前極少被開發運用的非結構化資料。
Velocity:
即時性。若肯多花時間等待,即使數據量龐大,很多時候也可用傳統方法獲得分析結果,但Big Data做為市場預測及行銷策略擬定的前置作業,面對快速變化的市場,資訊的價值就在於即時性。
為何Big Data如此重要?
資料分為結構化與非結構化兩大類,如姓名、住址、日期、交易明細等可以建立一個二維表格,就把資料填入表格的資料類型,就屬於結構化資料。而非結構化資料則包括文件、影片、圖片、語音、社交通訊訊息、近場無線通訊及感測器所接收資訊。
而因為數據資料的龐大,已對一般的資料庫處理分析軟體產生負擔,再加上資料量的增加主要來自於非結構化資料,更顯現傳統資料庫功能上的侷限性。如以一個企業所擁有的資訊量來看,有20%為結構化資料,透過統計資料、預測分析、資料採礦、文字採礦、預測及最佳化,將數據轉換成知識。而今為了還未獲得妥善運用且越來越受重視的80%非結構化資料,Big Data將發揮其功能,結合這80%的非結構化資料領域專業知識(Domain Know-How),除了萃取出其中的商業智慧(Business Intelligence),達到更多許多預測性分析,使決策制定最佳化。
大數據智慧應用
在行動上網裝置數量的快速成長下,使用者與網路的互動性增加。Facebook每個月有12.3億活躍用戶在發文、分享、打卡與按讚;WhatsApp單日訊息量達640億則,就連Wal-Mart每小時也處理超過100萬筆客戶交易,目前總計全世界每日產生超過25億GB的資料量,2012年時全球儲存的資料量已超過2.8ZB,而研究機構預測,到了2020年,數量會來到現在的五十倍之多。
行動裝置的即時性,在Big Data的實際運用上,我們可分為兩大部份來探討,一為服務生活所需的各大網路平台,另一為未來科技發展趨勢的物聯網。在我們現在生活中可以強烈感受到的就是以各大知名網路平台為基礎,以社群、線上購物為中心的活動,「即時」&「移動」兩大特性,創造了移動社群與移動商務,兩大商機。而物聯網的建置有很大能量改變現有生活樣貌,生活變得更智慧、更便利,高階行動裝置內建的感測器已經多到可以支援各種物聯網應用,而行動裝置移動的優勢,不止加快物聯網的發展也讓物聯網這議題升級為智慧聯網。