「大數據」(big data)和「資料科學家」(data scientist)是近年來商業界的熱門關鍵字。不過,你感受到大數據的重要性,卻未必真正了解大數據和你我的工作、和企業的關聯性是什麼?以下 5 張圖,讓你快速了解大數據的商業應用。
Q1. 什麼是大數據?
A : 狹義的定義是指,符合「3V」條件的數據資料,分別是:
- Volume(大量):以過去的技術無法管理的資料量,資料量的單位可從 TB(terabyte,一兆位元組)到 PB(petabyte,千兆位元組)。
- Variety(多樣性):企業的銷售、庫存資料;網站的使用者動態、客服中心的通話紀錄;社交媒體上的文字影像等企業資料庫難以儲存的「非結構化資料」。
- Velocity(速度):資料每分每秒都在更新,技術也能做到即時儲存、處理。廣義的定義,《大數據的獲利模式》作者城田真琴認為,還要包括具備儲存、處理與分析這些資料的技術,和能夠從這些資料中取出有用資訊或洞見的人才和組織。
Q2. 大數據分析和商業智慧(BI,business intelligence)有什麼不同?
A : 美國顧問機構顧能(Gartner)分析師霍華‧瑞斯納(Howard Dresner)在 1980 年代提出「商業智慧」概念,指有系統地儲存企業內、外部資料,並加以分析,輔助商務決策。瑞斯納認為,經理人應該親自經手資料,以達到迅速決策與提高生產力的目標。
商業智慧可分析過去發生什麼事,以及為什麼會發生這件事,像是利用統計學回歸分析,從A產品過去一年的銷量結構,找出銷售下滑的原因。大數據則可根據目前發生了什麼事,預測未來將發生什麼事。例如,電商可即時監控銷售情況,預測顧客回購周期。
Q3. 一般企業有哪些數據可用?
A :《大數據的獲利模式》作者城田真琴將企業能取得的資料分為 4 種:
- 公司本身的事業活動資料:屬於公司的核心資料,例如便利商店的 POS 系統資料。
- 公司背景資料:比方說員工的通訊錄或財務報表,但是對服務顧客沒有幫助。
- 其他公司或顧客的資料:像是顧客在社交網站上的活動紀錄,就是企業即使花錢也想拿到的資料,因為對自己很有用。
- 公開資料:通常可以免費取得,企業應該積極運用例如政府的公開資訊,例如政府的公開資訊。
Q4. 企業如何運用數據資料?
A : 阿里巴巴(Alibaba, BABA-US)副總裁車品覺提出了數據的 5 大價值:
- 識別與串聯:能夠辨識出用戶的資訊(手機、生日、e-mail 等)
- 描述:舉凡用戶搜尋的關鍵字、企業的營運數字、網站活動的相關數據,企業都可以用來做為營運的儀表板。
- 時間:從用戶的行動時間軸推測他的行為,例如剛搜尋過旅館的使用者,在拜訪其他網站時,也能即時看到旅館廣告。
- 預測:可以幫助公司預測銷售,影響公司經營策略。
- 產出數據:將現有數據組合產生新的數據,像是將網路賣家的各項表現(物流、商品、客服等),綜合在一起形成店鋪評分機制。
Q5. 運用大數據的人,就可以稱為資料科學家嗎?
A : 基於前述資料的特性,大數據的儲存、處理和分析絕非易事,通常需要團隊支援,才能發揮出資料的最大效果。
大致來說,資料分析領域包含 5 個關鍵職務:資料工程師與軟體工程師負責資料的清理、儲存和處理;資料分析師將資料視覺化,供資料科學家分析;資料科學家依據想要解決的商業命題建構模型,供決策參考;領域專家則是熟悉領域專業知識,提供專業見解供資料科學家分析參考,扮演發展決策的橋梁。
資料來源:《大數據的獲利模式》,經濟新潮社出版;《大數據的關鍵思考》,天下雜誌出版;工研院產經中心 IEK 跨領域研究小組
《經理人》授權轉載
【延伸閱讀】