高盛用1000萬的投資,暴露了金融業可能根本沒有大數據的現實創投
大數據行業中又出現了一例引人矚目的投資,一家名為Crux Informatics的初創公司拿到了1000萬美元的種子輪。1000萬的金額不值一提,但這次投資的領投者是投行大鱷高盛。
Crux Informatics也只專注兩件金融行業的事:第一,處理非結構化數據。第二,建立信息供應鏈保證各個金融機構的數據隱私,確保他們不被私自售賣和利用。
綜合兩點來看,Crux Informatics很可能是高盛在大數據領域最正確的一筆投資。
金融業有大數據?哈哈哈哈哈
說這話的原因,可以先用一個笑話來解答。
“Big Data is like teenage sex: Everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it too .”
大數據就像是青春期的性生活:每個人都在討論,卻沒人知道到底要怎么做,每個人都覺得別人已經做過了,所以每個人都聲稱自己也有。
沒錯,在金融行業,尤其是傳統金融機構中,大數據應用的比例要比我們想象中低得多。原因主要有以下兩點:
第一,金融機構數據敏感性高,金融機構自身對數據的處理能力卻不夠。
每個銀行的儲蓄信息、證券機構的交易記錄,這些數據不僅僅是我們作為客戶的隱私,更關系著金融機構自己的經營狀況、操作經驗。交給科技企業來處理,沒有意外萬事大吉,可要是出了點什么狀況,客戶們忙著擠兌已經是最好的情況,要是有哪個程序員暗搓搓的用深度學習從交易記錄中訓練一個操盤模型……投行經營們只有哭的份了。
于是,我們會看到高盛、摩根大通這些大鱷這幾年在人工智能技術方面的投資并不落后于科技企業。不過,那些中小金融機構該怎么辦?
第二,金融機構中有大量非結構數據沒能被利用。
關于結構化數據和非結構化數據的區別此前已經解釋過很多,簡單來說一類信息能夠用數據或統一的結構加以表示,我們稱之為結構化數據,如數字、符號;反之則是非結構化數據,比如圖像、音頻、視頻、辦公文檔等等。
在金融機構自身產生的數據中,只有很少一部分是結構化數據,比如客戶的存款數額、貸款數額、購買理財產品的編號等等。如果光用這些東西建立一個風控模型,相信一定是個不怎么精確,在市場上也沒什么競爭力的模型。
而金融機構中最有價值的,還是那些非結構化數據,小到用戶住址、學歷、各種資產證明的復印件,大到操盤手們的交易記錄。可這些數據都以圖片、表格等等形式存在數據庫中,沒準還會定時被覆蓋掉。金融機構自己是很難有能力處理這些數據的,根據結構化數據建立模型幾乎是他們的極限了。可要是尋找外援來處理,就又回到了第一個問題,如何保證數據的隱私?
于是,為了解決這種迷之循環,高盛干脆找了一家能夠一次解決兩個問題的公司。
非結構化數據到底有多重要?
由于資料不足,我們暫時不能了解到Crux Informatics用來保護數據隱私的“信息供應鏈”究竟是什么,從字面上看,很有可能是區塊鏈技術。不過,我們可以討論一下保護數據的下一步:利用非結構化數據,對于金融機構來說到底有多重要。
先從最常說的風控談起。我們理解的風控或許只是在放貸之前考察一下這個人有沒有償還能力,其實對于金融來說,風控常常貫徹在金融交易的整個過程中。
比如在涉及到工農業生產的供應鏈金融中,即使貸款主體有著足夠的資質和償還能力,金融機構更想看到的局面還是對方能夠按時償還貸款,而不是百般索求甚至沒收對方的資產。這時動態的、精準的風控能力就非常重要。
最簡單的例子:金融機構對歷史數據進行整理,發現以往有過惡劣天氣導致農作物歉收、貸款主體無法償還貸款的情況。就可以在相同情況發生時,提前做出調整。
除了風控之外,在精準營銷上非結構化數據也能起到作用。從廣告投放到為客戶推薦組合基金,每一步都需要對客戶群體有著足夠的了解。而想要了解客戶,光靠存款金額是遠遠不夠的。
比如向一位客戶推薦產品時,我們可以粗暴的從他以往的購買記錄判斷他的喜好和風險承受能力,也可以通過他留在金融機構的其他數據:房產證、學歷、行駛證來給出更完善的畫像,教育程度偏低的人或許更傾向于保守投資,住在繁華地段、開豪車的人也許會因為更高的生活成本而無法承受風險……
我們甚至可以把電商的推薦算法應用起來,看看住在同一片區域的人是否有著相似的理財傾向。
總之,這一切都要依靠銀行自己的非結構化數據。
尷尬的國情下,金融數據創業者能和BAT共舞嗎?
當我們把目光放回中國,情況又有些不同。
在金融機構數據的敏感度上,因為眾所周知的原因,相比國外我們有過之而無不及。至于金融機構本身數據技術能力就更為尷尬,國有銀行在金融產業占有優勢地位,可大體量、國字頭往往又意味著在新晉技術上稍微落后。
最后導致中國全體金融機構對于大數據的利用都較弱。這其中又會存在著哪些機會?
首先,BAT等巨頭企業恐怕會成為這種情況下最大的受益者。
當無法利用自身數據,卻又想追趕上大數據浪潮時,金融機構們紛紛開始選擇直接利用科技企業的大數據成果。而BAT們壟斷了大量的社交數據、電商數據和行為數據。甚至可以說,走出不能被利用的數據禁地,就又進入了被BAT們壟斷的大數據海洋。
加上BAT的技術人才儲備和豐富的營銷渠道,直接把風控模型和精準營銷交給他們是很好的選擇。
但這也不證明創業團隊就失去了用武之地。
BAT們雖然有著絕對優勢,但他們多少都會涉及到金融業務,難免會和金融機構有競爭關系。目前雙方處于“擱置爭議,共同開發”的時期,不過也給了小團隊另一種籌碼。
想要與大象共舞,小團隊顯然不必用數據量和BAT們硬碰硬,從細微之處進行創新是個不錯的選擇。
比如算法:試著從現在流行的深度學習、增強學習等等角度出發,用算法去解決金融行業的需求,應用于高頻交易的“冰山算法”就是個不錯的例子。
比如智能硬件:在物聯網的未來,用各種智能硬件增加數據收集的維度一定是重要趨勢。開發能收集豐富農業、工業、零售業數據的智能硬件,一定會引起金融機構的興趣。
比如區塊鏈:用區塊鏈安全、隱私等特性解決金融機構數據敏感這一終極問題,還擔心拿不到融資?以ICO潮的熱度來看,相信我國一定有足夠多的區塊鏈技術團隊!
能做到以上幾點中的任何一點,就算不能拿到金融機構的巨額投資,也一定能拿到BAT的投資,拿不到投資一定會被BAT收購,沒被BAT收購……那就是被BAT抄襲了。
玩笑歸玩笑。金融行業大數據領域大有可為,不管是大公司還是小團隊,現在都還站在同一起跑線上呢。
來源:腦極體
1.砍柴網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;2.砍柴網的原創文章,請轉載時務必注明文章作者和"來源:砍柴網",不尊重原創的行為砍柴網或將追究責任;3.作者投稿可能會經砍柴網編輯修改或補充。