根據《連線》網站報導,機器人記者已經出現在我們的生活中。美聯社宣布,將採用軟體自動生成關於大學體育賽事方面的新聞報導,而該社之前尚未關注該領域。該軟體稱之為Wordsmith,由來自北卡羅來納的公司Automated Insights開發。
這是大型新聞機構轉向使用算法創造內容的最新案例。美聯社是Automated Insights的投資者之一,他們此前已經利用Wordsmith生成公司財報方面的報導。其間,自動內容生成領域方面的競爭對手Narrative Science也在為包括《財富》及Big Ten Network在內的客戶提供類似服務。去年,在地震發生後,來自《洛杉磯時報》的記者也用定制軟體自動生成了相關新聞。
但是,這些由機器自動生成的內容會有人閱讀嗎?Automated Insights的CEO羅比·艾倫(Robbie Allen)表示,這個問題問得不對。雖然公司在2014年生成了超過10億份內容,但是大部分並非面向普通觀眾。Wordsmith更像某種類型的個人數字科學家,其從海量、未經加工的數據中進行分析,為某些甚至某一位觀眾生成定制內容。
例如,公司在夢幻橄欖球賽期間就為數億雅虎(母公司 Verizon, VZ-US)用戶生成了賽況總結報導,將難以閱讀的表格以直觀明晰的形式呈現。某天,你也可以擁有自己的個人機器人記者,為你整理每日的個人健身數據及財務信息。
“這顛覆了傳統的內容生成模式,”他說道。“以往,一個報導可以獲得100萬瀏覽量,而現在,我們將生成100萬個報導,每個獲得1次瀏覽量。”
Wordsmith
Wordsmith本質上會完成兩件工作。首先,它查看並分析海量結構化數據,從中發掘出興趣點,例如,某個選手在某場比賽的表現不如預期。然後,以人類可讀的形式生成內容。
艾倫於8年前有了創造這種軟體的想法,當時他還是思科(Cisco Systems Inc, CSCO-US)的一位工程師。在做這之前,他已經擁有10本著作,而現在,他想要做一點別人沒有做過的事情。因此,他決心將自己對電腦科學、寫作以及體育賽事分析的激情結合在一起,結果便是StatSheet公司的誕生。“在體育賽事的報導中,90%的工作就是填寫各類數字,” 艾倫說道。然而,艾倫很快意識到他的想法不僅僅能夠用在體育方面,定量數據方面也同樣適用。於是,他將公司的名稱變更為現在的Automated Insights,公司的目標產業也隨之擴展到了包括金融、醫療及傳媒在內的各行各業。
自動化
目前,Wordsmith還只能配合結構化的定量數據工作,這些數據通常保存在電子表格及數據庫中。艾倫表示,包括研究或寫作過程的自動化、重新撰寫新聞稿件或者對非結構化文檔篩選並生成摘要的潛力將無限,但是他覺得公司目前尚不能偏離定量分析的方向。
上月,公司被私募股權公司Vista Equity Partners收購,後者同時擁有體育數據公司STATS以及商業智能公司TIBCO。通過與該私募旗下其他公司合作,艾倫表示他們手頭要完成的工作更多了。“我們現在感到有點無所適從,”他說道。“在結構化數據方面,我們已經有大量的機會,為何還需要貿然嘗試解決那些困擾人們多年的問題?”
現在,讓我們期待擁有自己專屬內容的那一天早日到來。(汪天盈)
《網易(NetEase, NTES-US)科技授權轉載》