假名技术

Showcase, discuss, and inspire with creative America Data Set.
Post Reply
Fgjklf
Posts: 348
Joined: Tue Dec 24, 2024 3:16 am

假名技术

Post by Fgjklf »

欧盟网络安全局(ENISA)最近的一份报告探讨了可以支持实践中实施假名化的技术解决方案。

原则上,假名化为假名分配标识符(即姓名、IP 地址、电子邮件地址等)。要使假名化功能有效,只有一个基本要求:它必须验证与标识符 id1 对应的假名pseudo1 与与标识符id2 对应的假名pseudo2 不同。否则,标识符的检索将是不明确的,我们无法确定pseudo1是否对应于id1或id2。然而,如果可以逆转此操作,则同一标识符可以与多个假名相关联。

在所有情况下,假名与原始标识符的关联都 牙买加手机号码列表 是通过所谓的假名化秘密来完成的。由于其对于假名化操作的有效性的重要性,相应的秘密必须通过适当的技术和组织措施来保护。假名秘密必须与数据集隔离,否则数据窃贼很容易恢复标识符。此外,强大的访问控制策略应确保只有授权人员才能访问此机密。最后,如果以数字方式存储,则必须对假名秘密进行加密,这需要适当的密钥管理和存储要求。

柜台
Counter 是最简单的假名技术。标识符被单调计数器选择的数字替换。计数器产生的值决不能重复,以避免任何歧义,这一点至关重要。该技术的最大优点是简单;然而,该解决方案可能会在大型、复杂的数据集上出现实现和可扩展性问题,因为需要存储整个假名映射表。

随机数生成器 (RNG)
RNG 是一种产生从总可能性群体中被选择的概率相同的值的机制。然后将这些不可预测的值分配给一个标识符。创建此映射有两种选项:真随机数生成器或加密伪随机数生成器。 RNG 提供了强大的数据保护,因为除非映射表受到损害,否则很难提取有关初始标识符的信息。然而,根据去识别场景,可扩展性可能是一个问题,因为必须存储整个假名映射表。

加密哈希函数
加密哈希函数采用任意长度的输入字符串并将它们映射到固定长度的输出。哈希函数直接应用于标识符以获得相应的假名,这取决于函数产生的摘要的长度。哈希函数有助于增强数据隐私性;然而,它被认为是一种较弱的假名技术,因为它容易受到暴力破解和字典攻击。

消息验证码 (MAC)
MAC 被认为是密钥哈希函数,因为生成假名需要密钥。如果不知道此密钥,就不可能映射标识符和假名。 HMAC 是互联网协议中最流行的 MAC 设计。 MAC 通常被认为是一种强大的数据保护假名技术,因为只要密钥没有被泄露,恢复假名是不可行的。该方法的不同变体可以应用于不同的实用性和可扩展性要求。

加密
加密是另一种强大的假名技术,只要加密密钥没有被泄露。尽管许多人认为加密是一种匿名技术,但需要“秘密”(加密密钥)来为假名分配标识符,这一事实使得密文成为假名,因此成为个人数据。通过加密去识别的标识符的长度受到要使用的加密的块大小的限制。

密码学的进步,例如完全同态加密 (FHE),可以通过允许在不解密加密数据的情况下对加密数据进行操作来使加密数据匿名。不幸的是,由于计算开销较高,FHE 目前效率非常低,并不是处理个人数据的实用替代方案。
Post Reply