?
圖片來源于網(wǎng)絡(luò)行業(yè)觀察
最近,整個大數(shù)據(jù)產(chǎn)業(yè)迎來多事之秋。從今年9月開始,多家數(shù)據(jù)企業(yè)先后被曝出負(fù)責(zé)人被查或公司暫停營業(yè)的消息,很多公司因此面臨嚴(yán)重的生存危機。
近一個多月以來,杭州、深圳等多地公安出動警力,帶走多家大數(shù)據(jù)風(fēng)控平臺高管協(xié)助調(diào)查。一時間,整個數(shù)據(jù)行業(yè)風(fēng)聲鶴唳,從業(yè)者人人自危。
那么,形成這一問題的原因是什么?有關(guān)部門又該如何對數(shù)據(jù)行業(yè)進行有效治理?
制度建設(shè)滯后致問題頻出
隨著大數(shù)據(jù)技術(shù)的發(fā)展和成熟,數(shù)據(jù)逐漸成為一種十分重要的生產(chǎn)要素,通過對數(shù)據(jù)進行分析,相關(guān)從業(yè)者可以挖掘出巨大的商業(yè)價值。
在這種背景下,大量企業(yè)開始將資源投入到對數(shù)據(jù)的搜集、整理,以及處理工作上,大數(shù)據(jù)產(chǎn)業(yè)開始蓬勃發(fā)展。然而,在大數(shù)據(jù)產(chǎn)業(yè)高速發(fā)展的同時,相關(guān)的制度建設(shè)卻稍顯滯后。相關(guān)法律和制度的空缺,使與數(shù)據(jù)有關(guān)的問題層出不窮。
在這些問題中,比較引人重視的有三個:一是侵犯隱私。這主要發(fā)生在數(shù)據(jù)搜集環(huán)節(jié)。為了從用戶身上獲取到有價值的信息,少數(shù)企業(yè)置用戶的隱私權(quán)于不顧,肆意侵犯。二是數(shù)據(jù)保護問題。這主要發(fā)生在數(shù)據(jù)的傳遞和儲存環(huán)節(jié)。由于安全保護工作的不到位,一些被搜集到的數(shù)據(jù)可能流出,從而對數(shù)據(jù)的相關(guān)利益方造成較大傷害。三是數(shù)據(jù)壟斷。這主要是指一些企業(yè)通過掌握更多、更好的數(shù)據(jù),從而獲得了更大的市場份額,并借此限制市場競爭。
目前,已有很多學(xué)者對關(guān)于數(shù)據(jù)產(chǎn)生的各種問題進行了分析和解讀,但從整體上看,這些學(xué)者提出的方案,更多集中在法律和制度的層面上。但從根本上來講,上述數(shù)據(jù)問題其實屬于技術(shù)問題,要想解決它們,須先從技術(shù)上找到問題根源所在,再用技術(shù)的手段去解決。
中心化處理模式引發(fā)連鎖反應(yīng)
盡管隱私侵犯、數(shù)據(jù)保護、數(shù)據(jù)壟斷這三個問題,無論是在內(nèi)涵上還是在表現(xiàn)上都截然不同,但從根本上來看,他們都是由數(shù)據(jù)的中心化處理模式所導(dǎo)致的。
在當(dāng)前通用的數(shù)據(jù)處理技術(shù)之下,人們對數(shù)據(jù)進行分析,就要從數(shù)據(jù)中挖掘出有用的信息,就需先把分散的數(shù)據(jù)搜集到一起,再對這部分統(tǒng)計數(shù)據(jù)進行處理。如果數(shù)據(jù)是分散的,人們對此便無能為力。
這種中心化的處理模式導(dǎo)致了很多后果:
首先,這促使數(shù)據(jù)的分析者需要千方百計去搜集數(shù)據(jù)。在此過程中,就可能違反相關(guān)的規(guī)定,或侵犯人們的隱私。
其次,在匯集數(shù)據(jù)時,需將數(shù)據(jù)在不同的主體間進行傳遞,而此過程是很難被追蹤的,這就決定了如果數(shù)據(jù)在傳遞過程中發(fā)生問題,原來擁有數(shù)據(jù)的主體將很難對其進行控制。以去年被曝出的劍橋分析事件為例,盡管在此事中臉書公司(Facebook)一直處在輿論的風(fēng)口浪尖,但真正造成數(shù)據(jù)泄露和濫用的卻是劍橋分析公司。
再次,現(xiàn)在備受詬病的所謂數(shù)據(jù)壟斷問題,在一定程度上其實是掌握數(shù)據(jù)的企業(yè)為了防止數(shù)據(jù)泄露而做的防范。其實,很多掌握數(shù)據(jù)的企業(yè)都可以通過開放數(shù)據(jù)來為自己獲取收益,但考慮到由此產(chǎn)生的問題,他們在采取這樣的舉措時都很猶豫。尤其是在劍橋分析事件發(fā)生之后,很多數(shù)據(jù)企業(yè)對數(shù)據(jù)安全的疑慮陡然增加,一改以往開放數(shù)據(jù)的態(tài)度,轉(zhuǎn)而變得十分封閉。
基于以上原因,為了解決數(shù)據(jù)帶來的眾多問題,制度和法律建設(shè)固然重要,但要從根本上解決,可能還要依靠數(shù)據(jù)的力量,讓目前中心化處理數(shù)據(jù)的模式發(fā)生改變。
新技術(shù)有望“治愈”數(shù)據(jù)頑疾
盡管要全面解決因數(shù)據(jù)產(chǎn)生的問題并不容易,但一些技術(shù)的發(fā)展已讓我們看到了希望。在眾多的技術(shù)當(dāng)中,有三種技術(shù)可能是較值得重視的:
第一種是區(qū)塊鏈技術(shù)。區(qū)塊鏈技術(shù)有一個重要的特征,就是可追蹤溯源,這一技術(shù)可全面記錄數(shù)據(jù)傳遞過程中的所有信息。這樣,一旦數(shù)據(jù)在傳遞過程中發(fā)生問題,就可清楚地知道問題發(fā)生在哪個環(huán)節(jié)、應(yīng)由誰來承擔(dān)相關(guān)責(zé)任。
第二種是安全多方計算技術(shù)。這一技術(shù)由清華大學(xué)教授姚期智提出,后來姚期智還憑此獲得了圖靈獎。安全多方計算技術(shù)的要點,在于保證“零知識證明”的提供。
何為“零知識證明”呢?舉例來說,若有兩個富翁想知道二者誰更有錢,但又不愿泄露自己的財富信息。那么,他們可將自己的財富信息以某種加密的方式告訴第三方,讓第三方進行比較。實現(xiàn)這個過程的技術(shù)有很多,安全多方計算技術(shù)就是其中很有代表性的一種。有了這個技術(shù),不同主體在數(shù)據(jù)交換的過程中,就可防止無關(guān)信息的泄露,因此數(shù)據(jù)傳遞的安全性就得到了保障。
第三種技術(shù)是谷歌正在推行的“聯(lián)合計算”。和傳統(tǒng)的中心化處理方式不同,“聯(lián)合計算”不再采用搜集數(shù)據(jù)、集中處理的數(shù)據(jù)分析模式,而將模型分發(fā)到用戶手中,直接在用戶端訓(xùn)練模型。這樣,數(shù)據(jù)分析者就可以在不從用戶處搜集數(shù)據(jù)的情況下,完成模型的訓(xùn)練和數(shù)據(jù)的分析。這樣不僅能保證數(shù)據(jù)的安全,也可從源頭上杜絕數(shù)據(jù)壟斷問題的發(fā)生。
數(shù)據(jù)問題是隨技術(shù)的發(fā)展產(chǎn)生的,而技術(shù)本身或許也早已為這些問題的解決埋下了伏筆。筆者相信,只要我們善于利用新的技術(shù),數(shù)據(jù)產(chǎn)生的各種問題遲早會得到解決。(作者系《比較》雜志研究部主管)
?
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請與我們聯(lián)系,我們將第一時間刪除。