什么是差分隱私?
我們生活在大數(shù)據(jù)時(shí)代,數(shù)據(jù)隱私問(wèn)題更加受到關(guān)注。人類(lèi)每秒產(chǎn)生數(shù)量驚人的數(shù)據(jù),公司將這些數(shù)據(jù)用于廣泛的應(yīng)用。隨著數(shù)據(jù)以前所未有的速度存儲(chǔ)和共享,必須有更多的隱私保護(hù)技術(shù)。
差分隱私就是這樣一種保護(hù)個(gè)人數(shù)據(jù)的方法,事實(shí)證明它比我們的許多傳統(tǒng)方法更有效。它可以定義為一種系統(tǒng),通過(guò)描述數(shù)據(jù)集中的組模式來(lái)公開(kāi)共享有關(guān)數(shù)據(jù)集的信息,同時(shí)保留有關(guān)數(shù)據(jù)集中個(gè)人的信息。
差異隱私使研究人員和數(shù)據(jù)庫(kù)分析師能夠從數(shù)據(jù)庫(kù)中獲取有價(jià)值的信息,而不會(huì)泄露有關(guān)個(gè)人的個(gè)人身份信息。這一點(diǎn)很重要,因?yàn)樵S多數(shù)據(jù)庫(kù)都包含各種個(gè)人信息。
另一種看待差異隱私的方式是,它通過(guò)向數(shù)據(jù)集中注入噪聲來(lái)創(chuàng)建匿名數(shù)據(jù)。引入的噪音有助于保護(hù)隱私,同時(shí)仍然受到足夠的限制,因此分析師可以可靠地使用數(shù)據(jù)。
您可以擁有兩個(gè)幾乎相同的數(shù)據(jù)集。一個(gè)有您的個(gè)人信息,一個(gè)沒(méi)有。使用差分隱私,您可以確保統(tǒng)計(jì)查詢產(chǎn)生給定結(jié)果的概率是相同的,無(wú)論它在哪個(gè)數(shù)據(jù)庫(kù)上執(zhí)行。
差分隱私如何運(yùn)作?
差異隱私的工作方式是通過(guò)向數(shù)據(jù)集引入隱私損失或隱私預(yù)算參數(shù),通常表示為epsilon(ε)。這些參數(shù)控制向原始數(shù)據(jù)集添加多少噪聲或隨機(jī)性。
例如,假設(shè)您在數(shù)據(jù)集中有一列包含個(gè)人的“是”/“否”答案。
現(xiàn)在,假設(shè)您為每個(gè)人擲硬幣:
- 負(fù)責(zé)人:答案保持原樣。
- 反面:你第二次翻轉(zhuǎn),如果是正面,則記錄答案為“是”,如果是反面,則記錄為“否”,而不管真正的答案是什么。
通過(guò)使用此過(guò)程,您可以為數(shù)據(jù)添加隨機(jī)性。使用大量數(shù)據(jù)和來(lái)自噪聲添加機(jī)制的信息,數(shù)據(jù)集將在聚合測(cè)量方面保持準(zhǔn)確。由于隨機(jī)化過(guò)程,隱私通過(guò)允許每個(gè)人合理地否認(rèn)他們的真實(shí)答案來(lái)實(shí)現(xiàn)。
雖然這是差分隱私的一個(gè)簡(jiǎn)單示例,但它提供了基本的理解。在實(shí)際應(yīng)用中,算法更為復(fù)雜。
同樣重要的是要注意,差分隱私可以在本地實(shí)施,即在個(gè)人數(shù)據(jù)集中在數(shù)據(jù)庫(kù)中之前將噪聲添加到個(gè)人數(shù)據(jù)中,或者在全球范圍內(nèi)實(shí)施,即在從個(gè)人收集原始數(shù)據(jù)后將噪聲添加到原始數(shù)據(jù)中。
差分隱私的例子
差分隱私廣泛應(yīng)用于推薦系統(tǒng)、社交網(wǎng)絡(luò)和基于位置的服務(wù)等應(yīng)用程序。
以下是大公司如何依賴差異隱私的一些示例:
- Apple使用該方法從iPhone和Mac等設(shè)備收集匿名使用情況的見(jiàn)解。
- Facebook使用差分隱私來(lái)收集可用于有針對(duì)性的廣告活動(dòng)的行為數(shù)據(jù)。
- 亞馬遜依靠這項(xiàng)技術(shù)來(lái)深入了解個(gè)性化購(gòu)物偏好,同時(shí)隱藏敏感信息。
Apple在使用差異隱私來(lái)深入了解用戶的同時(shí)保護(hù)他們的隱私方面一直特別透明。
“Apple已經(jīng)采用并進(jìn)一步開(kāi)發(fā)了一種在學(xué)術(shù)界被稱為本地差異隱私的技術(shù)來(lái)做一些真正令人興奮的事情:深入了解許多Apple用戶正在做什么,同時(shí)幫助保護(hù)個(gè)人用戶的隱私。這是一種使Apple無(wú)需了解社區(qū)中的個(gè)人即可了解用戶社區(qū)的技術(shù)。差分隱私會(huì)在信息離開(kāi)用戶設(shè)備之前轉(zhuǎn)換與Apple共享的信息,這樣Apple就永遠(yuǎn)無(wú)法復(fù)制真實(shí)數(shù)據(jù)。”
–Apple的差分隱私概述
差分隱私的應(yīng)用
由于我們生活在這個(gè)大數(shù)據(jù)時(shí)代,因此存在許多威脅政府、組織和公司的數(shù)據(jù)泄露事件。與此同時(shí),當(dāng)今的機(jī)器學(xué)習(xí)應(yīng)用依賴于需要大量訓(xùn)練數(shù)據(jù)的學(xué)習(xí)技術(shù),這些數(shù)據(jù)通常來(lái)自個(gè)人。研究機(jī)構(gòu)還使用和共享具有機(jī)密信息的數(shù)據(jù)。以任何方式不當(dāng)披露這些數(shù)據(jù)都會(huì)給個(gè)人和組織帶來(lái)很多問(wèn)題,嚴(yán)重時(shí)甚至?xí)?dǎo)致民事責(zé)任。
像差分隱私這樣的正式隱私模型解決了所有這些問(wèn)題。它們用于保護(hù)個(gè)人信息、實(shí)時(shí)位置等。
通過(guò)使用差分隱私,公司可以在不泄露數(shù)據(jù)的情況下訪問(wèn)大量敏感數(shù)據(jù)用于研究或業(yè)務(wù)。研究機(jī)構(gòu)還可以開(kāi)發(fā)特定的差分隱私技術(shù),以在越來(lái)越受歡迎的云共享社區(qū)中實(shí)現(xiàn)隱私過(guò)程的自動(dòng)化。
為什么使用差分隱私?
差異隱私提供了一些主要屬性,使其成為在確保隱私的同時(shí)分析私人數(shù)據(jù)的優(yōu)秀框架:
- 隱私損失的量化:差分隱私機(jī)制和算法可以衡量隱私損失,這使得它能夠與其他技術(shù)進(jìn)行比較。
- Composition:由于可以量化隱私損失,因此還可以通過(guò)多次計(jì)算對(duì)其進(jìn)行分析和控制,從而實(shí)現(xiàn)不同算法的開(kāi)發(fā)。
- 群體隱私:除了個(gè)人層面,差異化隱私使您能夠分析和控制較大群體之間的隱私損失。
- 后處理安全:后處理不會(huì)損害差分隱私。例如,數(shù)據(jù)分析師無(wú)法計(jì)算差分隱私算法輸出的函數(shù)并將其降低差分隱私。
差分隱私的好處
正如我們前面提到的,差分隱私優(yōu)于許多傳統(tǒng)的隱私技術(shù)。例如,如果所有可用信息都是可識(shí)別信息,則差分隱私可以更輕松地識(shí)別數(shù)據(jù)的所有元素。它還可以抵抗基于輔助信息的隱私攻擊,防止可以對(duì)去標(biāo)識(shí)化數(shù)據(jù)進(jìn)行的攻擊。
差異隱私的最大好處之一是它是組合的,這意味著您可以計(jì)算對(duì)同一數(shù)據(jù)進(jìn)行兩次差異隱私分析的隱私損失。這是通過(guò)對(duì)兩項(xiàng)分析的個(gè)人隱私損失求和來(lái)完成的。
雖然差分隱私是一種新工具并且很難在研究團(tuán)體之外實(shí)現(xiàn),但易于實(shí)施的數(shù)據(jù)隱私解決方案正變得越來(lái)越容易獲得。在不久的將來(lái),我們應(yīng)該會(huì)看到越來(lái)越多的此類(lèi)解決方案可供更廣泛的公眾使用。
- 上一篇
邊緣計(jì)算及其發(fā)展方式
邊緣計(jì)算是導(dǎo)致網(wǎng)絡(luò)世界發(fā)生重大變革的新興范式。邊緣計(jì)算提供的主要優(yōu)勢(shì)是減少延遲、帶寬優(yōu)化和更快的數(shù)據(jù)處理,從而帶來(lái)更好的用戶體驗(yàn)。一切都取決于所討論的應(yīng)用程序的時(shí)
- 下一篇
什么是松耦合架構(gòu)?
松散耦合架構(gòu)是一種軟件應(yīng)用程序開(kāi)發(fā)模型,其中多個(gè)組件相互連接但彼此不嚴(yán)重依賴。盡管每個(gè)服務(wù)都是為執(zhí)行單個(gè)任務(wù)而創(chuàng)建的獨(dú)立實(shí)體,但這些組件共同創(chuàng)建了一個(gè)通用網(wǎng)絡(luò)或系統(tǒng)