大數據帶來的隱私泄露和歧視問題漸顯,數據發展正面臨轉折點觀點
很多人還沒搞清楚什么是PC互聯網,移動互聯網來了,我們還沒搞清楚移動互聯的時候,大數據時代又來了。
近年來,大數據已經覆蓋了許多領域,包括互聯網領域。許多應用和平臺熱衷于搜集用戶的信息。而在近日舉行的SXSW(South by Southwest,西南偏南)大會上,專家們卻表達了對于數據會歧視用戶的擔憂。
會上,獨立隱私安全專家Ashkan Soldani提及了IBM的一款能夠計算“恐怖主義得分”的軟件。這款軟件的目的是通過用戶數據,計算從敘利亞來到歐洲的人們參與恐怖活動的概率。
大數據(bigdata)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。但是,在大數據發揮重要作用的同時,也產生了一系列問題,給人們造成了困擾。
一、許多軟件因數據歧視用戶,造成諸多問題
目前,許多企業都會通過軟件或應用搜集用戶信息。在大數據時代,這種做法是無可厚非甚至是必要的,但是,用戶數據可能會使用戶遭到歧視,甚至造成濫用。
比如,電腦投放求職廣告時,就會產生歧視行為。去年,卡耐基梅隆大學的研究人員通過一款名叫AdFisher的工具,對其第三方網站上的廣告定向投放過程進行了追蹤。結果表明,當谷歌判定求職者為男性時,為其推送高新主管職位消息的概率遠大于同等條件的女性求職者。
記者Julia Angwin說:“你可能并不知道你為什么沒有得到那份工作,你或許永遠不會知道,其實是因為數據歧視了你”。
對此,AdFisher的開發者表示:“我認為,我們的發現揭露了目前廣告生態中開始浮現的諸多歧視和不透明現象。從社會的角度來看,它很值得擔憂”。
不僅是在工作方面,就連社交軟件都會因為數據歧視用戶。美國約會應用Tinder的付費版Tinder Plus推出后,其定價的差異化引發了爭議。在美國的用戶,18歲到29歲只需9.99美元,但是超過30歲的用戶則需支付19.99美元。而處在英國地區的用戶,18歲至27歲只需支付3.99英鎊,而超過28歲就必須支付14.99英鎊。
由于這樣的定價,關于Tinder歧視“大齡未婚青年”的言論一時蔓延開來。對此,Tinder副總裁的解釋是,年輕用戶是高頻使用者,但缺乏金錢,定價較低是為了刺激其購買欲。而大齡用戶對價格或許敏感度更低,所以愿意購買服務。因此,定價差異化是基于公司測算,并非年齡歧視。
不管這些應用是出于怎樣的目的,都或多或少地帶有歧視色彩,并且大數據有泄露用戶隱私之嫌。一份研究大數據影響的白宮報告中寫道:“我們長期堅持的公民權利保護政策對居民信息如何在住房、信用卡、雇傭、健康、教育和交易市場等方面使用有嚴格的限制,而數據分析技術有可能會擊潰這一防線”。
研究者指出,對于企業追蹤用戶的過程以及投放廣告的算法有一定的了解,對人權組織及監管機構來說,是相當重要的。當然,企業也應該采取一些相關的措施,消除數據對用戶帶來的歧視。
大數據是在互聯網時代不可避免的發展趨勢,但同時,它產生的問題也讓人們有些恐慌。
二、大數據發展正面臨轉折點,需努力趨利避害
大數據的意義就在于,從龐雜的數據背后挖掘并分析用戶的行為習慣與喜好,從而找出更符合用戶“口味”的產品和服務,并結合用戶需求有針對性地調整和優化自身。
這種作用對于當今企業來說,是極其重要的,其商業價值大致體現在四個方面。
大數據可以實現客戶群體細分,并為每個群體量身定制特別的服務;大數據可以對現實環境進行模擬,發掘出新的需求并使投資回報率有所提升;大數據可以加強部門之間的聯系,提高生產鏈條與管理鏈條的效率;大數據可以使服務成本降低,找出隱藏線索,對產品和服務進行創新。
對于社會來說,大數據的發展也是有諸多好處的。大數據定理表明,在試驗不變的條件下,重復試驗過程多次。在大量重復中,會呈現出幾乎必然的統計特性。
隨著計算機處理能力的增強,獲得的數據量越大,挖掘出的價值就越多。如果銀行能夠及時發現風險,社會經濟將越發強大;如果醫院能夠及時發現疾病,我們的身體會更加健康;如果通信公司能夠降低成本,我們的話費將更加實惠。
以上情況,都可以通過大數據的不斷積累和不斷分析實現。通過這一過程,我們可以發現規律,從而實現更好的未來。
但是,任何事物都有兩面性,大數據時代所產生的問題也同樣不少。
第一,數據不夠安全。無論是企業還是個人,在實踐過程中都會或多或少地產生數據。這些數據在當今時代并不安全,會有很多方法使它們泄露。
第二,數據泄露產生不平等。對于用戶來講,數據是一筆財富,但是遭到了別人的竊取,而自己并未得到任何收益,這對于用戶來說是不公平的。
第三,用戶隱私問題。當用戶在網上注冊信息后,這些信息很有可能已經被擴散,當用戶收到一些莫名其妙的郵件、電話、短信時,其實用戶的各種信息早已被非法的商業機構賤賣了。
無意中拍的照片,可能會使人一夜成名。用戶的想法、行為、都可能被商家記錄在案。人們擔心身份被盜用,擔心數據造假,害怕數據框定,反感數據的不公平造成的歧視。
要解決這些問題,需要克服許多困難,面臨巨大的挑戰。雖然企業可以更加細致地去檢驗他們的系統和流程,但是依然不能完全解決問題。通常數據驅動的決策都比較隱蔽,即使產生威脅,也不會被輕易發現。
任何的領域都需要統一,但是大數據行業尚不能立法,因為大數據趨勢變化多端,無法掌握立法所面臨的全部背景。
業內專家認為,有必要在計算機課程中增加數據倫理教育,并且更改有歧視傾向的計算機程序。盡管不能完全解決問題,但也能起到一定的作用。
馬云說:“很多人還沒搞清楚什么是PC互聯網,移動互聯網來了,我們還沒搞清楚移動互聯的時候,大數據時代又來了”。不管是喜是憂,大數據時代已經降臨。
哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程”。現在的大數據領域正面臨一個轉折點,努力的方向決定著其屬性的發展。我們應該盡量消減其負面影響,讓大數據發揮其正面作用,從而更好地為人類服務。
1.砍柴網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;2.砍柴網的原創文章,請轉載時務必注明文章作者和"來源:砍柴網",不尊重原創的行為砍柴網或將追究責任;3.作者投稿可能會經砍柴網編輯修改或補充。