在互联网时代,通过网站收集信息和资源是很常见的。通常,网页浏览器会记录用户访问的网站列表,即网页浏览的历史记录。
然而,即使是如此简单的网络行为也有隐藏的风险。8月份举行的 USENIX 会议上,Mozilla 研究人员向 展示了他们5.2 Firefox 用户在两周内分析了浏览历史数据集的结果。
结果表明,48、919 的浏览数据是可区分的,即 99% 的浏览历史是独一无二的。超过80%的用户可以通过浏览历史来识别身份。此外,只需考虑 50 是最常用的网站。
事实上,在 2012年,用户浏览记录分析用户身份的研究。其中,研究人员首先建立了一个测试网站,并使用 CSS 代码从 6000 个域名列表中识别参与者访问的网站。当时的研究结果显示,97%的受试者基于这个 6000 个域名形成了非常独特的浏览历史,仅此数据就可以用来跟踪和确认这些参与者。
而时下,Mozilla 本研究所使用的数据更准确,Mozilla收集了 的研究5.2 1000名参与者的所有浏览记录包括访问 3500 10000个独特域名的网站,这也是该领域的一项大型研究。
参与者先和 Mozilla 团队分享他们的浏览历史,然后,Mozilla 团队开始测试他们是否能从大量数据中重新识别这些用户。结果表明,99%的浏览记录是独一无二的,可以与用户一起使用“对号入座”。
此外,2012年和2020年的两次研究对比也显示了互联网时代的变化:八年前,识别用户的准确性为38%,500个网站的数据集为70%;今天,基于50个网站的重新识别准确率为50%,基于150个网站的重新识别准确率为90%。
伴随着5G随着技术的发展,人们创造的信息总量也以几何级数积累起来。研究表明,过去几年人类制造的数据占人类历史数据总量的95%。换句话说,大数据时代已经真正到来。
在互联网时代的后半段,我们的生理信息将进入沟通渠道,成为5G技术下的重要信息资源。通过用户浏览记录分析用户身份无疑将成为进入通信渠道的另一个重要数据。如何避免这些数据信息下的隐私暴露风险,创造更好的隐私保护路径仍有待探索。但任何技术的幻想都来自于人类和人性。人类的智慧不仅是技术的智慧,也是解决技术困难的智慧。