在很多方面,“大数据”和“加密” 是对立的,前者收集、存储和分析信息,以此来揭示对学者、法律实施和企业有用的规律;而后者的目标是窥探隐藏的数据。这个议题(tension)是本周的 一个由白宫科技政策办公室和麻省理工共同举办的会议的核心,这次会议有来自学术界、政界和商界的许多专家人士出席,他们探讨了加密技术以及其它以隐私为导向的技术,可以保护大数据所涉及的信息。
麻省理工计算机科学与人工智能实验室(CSAIL)的Shafi Goldwasser教授在座谈小组中说到,加密功能是必须要走的路。她还补充道,其余的选择比如匿名的数据记录并非有效。如今,在社交网络和其它的公共 网站上,可以免费获得大量关于个人的数据,任何一个想要做坏事的人都可以从任意数量的在线资源通过交叉引用来建立关于他们的目标的轮廓 (profile)。
一名来自麻省理工学院CASIL的副教授在周一的“隐私增强技术”座谈小组中谈道,如果数据只是简单地被存储起来,那么加密就可以非常完美地工作。 而当你真的需要处理和分析被存储起来的数据时,问题就出现了。然后他补充说,这也就是为什么现在需要一个实用性的处理加密数据的系统。
这种实际的努力通常是指所谓的“同态”加密,这使得它可以在不先对加密数据解密时而执行对加密数据的计算。20世纪70年代末,研究者一直强调完全同态加密是可能的,所谓的完全同态加密是指,在加密过程中,可以对信息以任意种方式进行切片或切块,而同时不显示实际的数据。这种系统可能对云计算[注]特别有利,因其提供了一种分析信息的方法,这种方法对信息提供者来说有最小的隐私风险。
然而,实际上,计算机科学家在对加密数据进行更多语义操作上,还没有开发出方法。IBM声称,2009年计算机科学家Craig Gentry已经开发出一个实用的且完全同态的系统,但批评者说,这项技术在实际的云计算的应用中太过于复杂、速度缓慢且不实用。IBM已为Gentry 的成果申请了专利且继续开发完善。
(责任编辑:)