有沒有什麼分析都一定扯上大數據的八卦?
好比一個總統大選辯論會,老人女人、有錢人,所有候選人都繞著它爭辯的關鍵詞,民意代表呼籲要跟上這波潮流,報紙登出一些連標題都嫌太長的社論,官員緩緩宣布我們要以大數據的概念建構…
然後你恍神了。
不久之後你的老闆也趕上這股流行,為了不顯得外行只好邊開會邊在桌子底下查維基百科,還有更多呢,人工智慧、回測,對於不是以看世界培養國際觀為業的你真是痛苦難當。
大數據對於一名散戶的意義何在?
大數據
大數據的定義沒有你想像的複雜多元,一般認為要有3個V,資料量(Volume)要夠大,資料輸入輸出速度(Velocity)要夠快,與資料變化度(Variety)要夠高,由於技術的突破,我們開始可以處理這些大量、快速輸入輸出或是不同結構的資料,運用在股市中可能是交易盈虧、籌碼變化等,當然,雲端運算技術降低成本門檻,配合各式資料源(社群資料、地理資料與行動資料)的易取得性,推動了這波大數據熱,但是別誤會,資料並不一定要大才有價值,我們不應該以資料量的大小來評估其資料分析的潛力,大數據的核心精神僅僅在於分析過去歷史資料來產生決策或預測,用白話說就是鑑往知來。
大數據僅僅是一個概念而不是一種方法,而應用大數據的方法包含多個學科的組合,包含統計、演算法、甚至是網路科學,因此下次當有人跟你說,「用大數據來解決…」,請他把方法說出來吧,例如「我用分群法來解決…」,不然只會徒增誤解。
大數據應用在投資策略中,較為普遍的有回測以及人工智慧兩種。
- 回測(程式交易)
回測運用在投資方法的分析已行之有年,特別是在期貨的程式交易,老牌軟體MultiCharts便提供程式開發環境讓投資人可以將投資想法轉換成策略,並利用歷史資料回測進行驗證投資方法的有效性,回測的技術方法是來自統計學分析,透過反覆嘗試 (又叫試驗法、暴力法)然後統計結果,然而這樣的方法缺點在於不夠彈性且受限於人為定義策略的限制,無法自動化的對特殊事件進行調整。比如榮化公司股價因為高雄氣爆事件股價重挫,期間若以價位或營收等資料作為條件設定回測,可能產生參考價值較低的結果,優點是你可以不用再從事些紙上談兵的模擬投資了,直接輸入你自己,或是你從某周刊某老師那邊學來的策略,透過回測服務機構的運算,就能了解「如果我這樣買賣會怎樣」。
- 人工智慧(機器人理財)
人工智慧是最常被提到用在大數據應用的基礎方法,包含機器學習與資料探勘都算是人工智慧的方法,相較於回測的反覆嘗試,人工智慧著重於根據資料性質設計假設模型(比如機率分布),並設計適合電腦運算的架構,除了分析歷史資料,更希望能讓電腦建立智慧(判斷準則),因此以機器人理財來說,目標是能夠全自動化的根據變動的金融訊息,針對股價或趨勢進行預測,並做出最佳投資決策,然而,雖然相關資訊技術不斷突破,人工智慧運用於投資決策目前仍多數停留在研究理論階段,可實行性尚難以評估。
回測(程式交易)與人工智慧(機器人理財)都算是大數據運用在金融商品的應用,其核心精神都是因為認為歷史一再重複,有跡可循,從而分析過去歷史資料來產生決策或預測,但兩者有其不同的方法和目標,所得到的結果也不會相同,投資人應該根據不同目的選擇合適的應用服務。