大量B站視頻被“搬用”,360又攤上事了?水煮娛
360又攤上事了,而且這次惹到了可能是中國互聯網上最不好惹的一群人。
總結了各方說法,目前事態大概如下:
大量B站用戶發現自己在B站上傳的視頻被“搬運”到了360旗下的視頻網站“快視頻”,包括復制了部分用戶的用戶名、個人簡介、頭像等,以及部分視頻的播放量、發布日期、評論(彈幕)。被復制搬運的包括了“共青團中央”、“西安交通大學”、“迪士尼中國”等組織、企業為主體的賬戶。
對此,快視頻方面的解釋為:部分用戶侵權了B站用戶的作品并冒用了他們的身份,已經開始下線處理。
部分B站用戶發現在快視頻上輸入自己注冊B站的登錄信息(郵箱/手機號)可以直接登錄從未注冊過的快視頻,并且快視頻上還能找到過去已經刪除掉的視頻作品。同時很多用戶提到了2016年這個年份,用16年的用戶名密碼可以登錄、現在已經被刪除的16年的作品被搬運等等。
對此,B站發布聲明通過技術手段沒有重現出此情況,能直接用B站密碼登錄快視頻。
可能為用相同密碼注冊過的360產品。
快視頻發布聲明稱沒有做出任何盜取用戶信息及隱私的行為。
雙方均沒有對“2016年”作出解釋。
對2233娘這樣那樣,真的…可以嗎?
在這里我們可以單純的從技術角度探討一下,如果360或者其他組織真的盜取了B站資源,可能是怎么做到的?
想批量搬運信息、資源至少有兩種方法,爬蟲和盜取數據庫。
關注機器學習的人一定對爬蟲非常熟悉,某種程度來講爬蟲是一種更高效的搜索引擎,通過自動提取網頁的程序按照規則獲取數據。有了海量數據,我們可以做到很多事:比如喂給算法訓練模型,又比如獲取售房網站上某一城市的平均房價,做出關于房產的大數據報告。在做這些事情時,爬蟲可以成為一種高效且無害的數據挖掘手段。
但爬蟲可以通過的方法自動爬取視頻、圖片網站中的文件數據,包括那些需要加載廣告、付費觀看下載的數據。我們可以很輕松的找到一款名為“You-Get”的開源爬蟲程序,用來下載視頻、音頻網站中的文件,也包括B站A站的彈幕。
如果360想依靠爬蟲手段批量獲得其他視頻網站的文件,相信一定會比開源的You-Get更加高效。但是這種方式是絕對不能獲取用戶密碼的,完全無法實現目前出現的B站用戶名密碼登錄快視頻的狀況。
但如果攻擊數據庫,就可以實現。最簡單的可以利用一種名為撞庫的手段,獲取用戶在某一網站上的用戶名密碼,再用同樣的用戶名密碼不斷嘗試其他網站。進入之后再進行拖庫,獲取該網站的數據庫,其中就包括了大量的用戶個人信息以及文件。
只是侵權?是什么讓B站和360達成共識
看到這里,一定很多人都心里一驚,為了方便好記憶,很多人都會在多個網站上使用同樣的用戶名和密碼,這樣一來豈不是很危險?
我們大可放心,對于拖庫撞庫這種普遍切低端的黑客手段,大多數網站都會有所防范。像我們每次登陸時都會輸入的驗證碼就是防范方法之一,通過各種驗證手段阻礙黑客用腳本反復試驗用戶名密碼嘗試登陸,每一次都設置不同的“路障”,以防止自動化攻擊。還有一些網站會實時監控用戶行為,如果用戶行為出現異常,像多次嘗試密碼錯誤,同一IP進入登陸頁面多次,點擊瀏覽速度過快等等,一旦發現用戶出現了這種類似機器腳本的行為時,就會利用各種方式進行阻攔。
有了這些防范措施,不但可以阻礙數據庫共計,也可以在一定程度上防止爬蟲。如果防范者是BAT,而攻擊者是一些不知名的黑客,我們一定會相信邪不壓正,黑客無法獲取到我們任何敏感信息。
可把兩者的身份放到360和嗶哩嗶哩身上,恐怕會給人們留下完全不一樣的印象。
360出身于網絡安全業務,這也意味著360掌握著相當高階的攻擊與反攻擊技術,同時360旗下有大量移動端/PC端產品,其中包括可以獲取各種權限的360手機衛士和可以記錄用戶名密碼的360瀏覽器。
至于嗶哩嗶哩呢,全身貼滿了二次元標簽、處于互聯網企業中的三-四線,這就注定了B站在技術人才的食物鏈中處于下游。而且還在在2016年還鬧出了一樁給技術大牛開5000月薪的新聞,據稱當時造成了大量技術人員人心浮動,甚至還有網友貼出了B站在Github上的招聘啟事,稱B站技術部門大換血。
值得注意的是,很多網友對嗶哩嗶哩對安卓開發人員的招聘要求提出了質疑,尤其是招聘中提到了一條了解“編譯原理”,這一條要求不僅和B站企業體量不匹配,而且在實際開發中用處不大。
但鑒于此條招聘啟事發布在較為專業的技術論壇Github上,應該不會出現HR部分代技術部分撰寫招聘啟事所以出現專業性錯誤的問題。結合當時的技術大牛離職傳聞,反而給人一種“B站技術部門遭辦公室政治,血洗大牛,當前技術人員專業度不夠,無法提出準確招聘要求”的不靠譜觀感。
兩者結合,在此次快視頻事件中,我們很容易想象成360對嗶哩嗶哩為所欲為,而嗶哩嗶哩毫無還手之力……
而嗶哩嗶哩目前極力否認用戶信息泄露、只談侵權,也很容易被聯想成掩蓋自己在安全技術上的不足。畢竟嗶哩嗶哩在去年剛剛按照規定進行了實名制認證,UP主們上傳了自己手持身份證的照片。如果這些信息和用戶名密碼一起泄露,后果將非常可怕。不僅僅會被拿去注冊各種P2P產品薅羊毛,如果被拿去注冊了其他內容網站,并發布一些反黨反社會、邪教等等違規內容……簡直讓人不敢想象。
這一系列后果,對于最近剛剛透露赴美IPO消息的嗶哩嗶哩來說幾乎是無法承受的。
現在事情還處于調查狀態,我們當然希望這只是一次以個人行為為主的單純的內容侵權事件,只是360和嗶哩嗶哩看起來都太像作惡者和受害者了。
如果真的只是侵權
在最后,我們想簡單談談視頻內容侵權這件事。
包括音頻、文字和圖片在內,視頻內容是最容易被侵權的內容形式之一。這里指的不僅僅是可以依靠爬蟲程序下載視頻重新上傳或避開廣告,而是對于平臺來說,檢索視頻的重復度非常困難。
文字、圖片都可以用低成本、快速的方法檢索重復度和相似度來避免侵權,但視頻文件卻很難做到。目前有一種技術叫“視頻指紋”,即通過運動狀態、幀間差異等方式提取視頻文件中獨一無二的特征,再通過比對來分辨是否重復??蛇@種方式依然需要耗費大量算力,對于視頻網站來說,實施起來恐怕是個不小的負擔。更何況,這種方式只適用于同一數據庫中的數據檢索,如果像快視頻這樣用戶盜用其他平臺上的內容,官方平臺是很難發現的。
目前各個視頻網站實行的水印、反爬蟲等等方式,大部分時候是防君子不防小人,對于B站UP主這樣個人為主體,沒什么精力和能力進行維權的內容創作者來說,盜取他們作品的成本實在太低了。B站對于UP主們的支持,也只能是在情況嚴重時替UP主們發布一份律師函??蛇@種事情不僅僅發生在嗶哩嗶哩和快視頻之間,甚至在嗶哩嗶哩、快手等平臺上,也會有UP主“無授權轉載”國外視頻平臺上的內容。到最后,我們竟然會發現連受害者都不是完全無辜的。
(快手上的搬運工們)
如果是以往,我們會從技術角度尋找一些可能的解決方法。但這一次,我們呼吁先從人的角度做起,只有當每個人都開始明白別人的勞動成果不能隨意分享時,才能截止這條無盡的“加害鏈”。
來源:腦極體
1.砍柴網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;2.砍柴網的原創文章,請轉載時務必注明文章作者和"來源:砍柴網",不尊重原創的行為砍柴網或將追究責任;3.作者投稿可能會經砍柴網編輯修改或補充。