密码学是安全通讯的基础。密钥是加解密讯息的重要依据。对于密钥持有者以外的人而言,唯有暴力破解或窃取密钥一途。前者需要庞大运算资源,可能一辈子都徒劳无功,后者相对而言容易许多。1970年代, Whitfield Diffie提出一个崭新的密钥分享协定,解决了如何安全传递密钥的难题,奠定现代安全通讯的基础,也因此获得图灵奖殊荣。然而随着AI与物联网的兴起,密码学也因此遭遇新的难题,本文将聚焦于其中三项前景看好的潜在解决方案。
大数据搜集与轻量密码学
大数据是机器学习的必要条件。人的时间和精力有限,若让人来搜集数据,有太多资讯会被忽略掉。物联网( Internet of things, IoT ) 正能解决这个问题。当今与网路相连的装置通常只有手机和电脑,而物联网的概念是将所有的装置都连成一个网路,以期能更有效地掌控并分析资讯,减少不必要的浪费和消耗。举例来说:如果家中灯泡、冷气、冰箱等家电的使用资讯,能透过物联网收集、记录,并利用人工智慧分析,便能依据使用需求设计出更省电的运作方式,甚至更好的家庭配电模式,提升发电厂效率。
但水能载舟亦能覆舟,物联网若遭有心人士恶意黑入,将会是一场难以想像的灾难。如果家内的冷气被恶意开启也许只是徒增困扰;但如果有人恶意将整个城市的所有电器同时开启,则可能造成发电厂过载、电网瘫痪,甚至影响国家安全,因此,加密通讯异常重要。但许多物联网装置的尺寸非常小,无论计算资源或电池寿命皆有限,无法完全满足通讯加密所需。于是一套不同于电脑通讯的物联网装置加密协定、一套「轻量加密」 ( Lightweight Cryptography ) 却又不在安全性上妥协的密码学,有其必要性。
隐私问题与同态加密
除了恶意黑客外,个人资料的搜集与隐私也是大数据的一大争议。就算使用大数据的机构恪守伦理规范,个资仍有可能流入有心人士手中。常见的情况,是当一般机构没有足够运算能力进行大数据分析时,常如图一A所示,向第三方租借如Amazon Web Service、 Google Cloud Platform等云端计算资源。计算完成后包含隐私资料在内的大数据,是否妥善删除是一大疑问。
同态加密( Homomorphic Encryption ) 是一能解决大数据隐私问题的方法。如图二B所示,工程师在上传数据前先将数据进行加密。为了对资料进行运算( f ),工程师对加密后的资料进行对应的同态运算( g )。g的作用是在资料被加密的状态下对资料做f运算,最后下载并解密得到目标函数f(x) 结果。透过这样的架构,上传到云端做计算的资料总是被预先加密过的,即使资料没有在事后被妥善删除,也没有人能阅读资料内容。这个领域对未来人工智慧的发展非常重要,但目前仍处于研究阶段。IBM今年发表了一篇论文[参2],将同态加密速度提升75倍,但相较于直接运算还是慢上许多。
信任与区块链
然而并非所有资料都适合同态加密。例如银行在处理与顾客间交易时,需要验证顾客的银行帐户确实有足够的资金进行交易,所以个人的经济资料不能对银行保密。这些资料在银行内部可说是一览无遗,理论上也能被窜改。我们不顾这些疑虑而仍然使用银行服务的原因,在于我们信任银行,用信任来弥补安全性上的疑虑。我们相信:尽管银行有能力窜改资料,他们不会这样做。但是再有信用的银行也可能有倒闭的一天,若要获得绝对的安全性,不能只依靠信任。
区块链( blockchain ) 于焉诞生。其原理是将所有帐户交易分散储存在区块链中。每个人都有一份区块链,所以不需要信任任何个人或银行。当完成交易时,交易的内容会被加密并且上传到区块链,形成一个新的区块。协助新区块加密的人可以获得奖励,也就是比特币等加密货币( 俗称挖矿)。若一个黑客想要窜改区块链上的资讯,如图二,他可以制造一个假的分支(图中分支2)。但是制造新的区块需要庞大的计算资源,只要这位黑客没有整个系统50%以上的计算资源,他制造区块的速度永远比其他诚实使用者还要慢。以比特币为例,系统会选择最长的区块链作为正统,所以真实的分支1会被选用,伪造的分支2则会被淘汰。在如此的防伪机制下,资讯一旦被放在区块链上便难以遭到窜改。
区块链目前仍是积极开发中的领域,由于其庞大的经济价值,发展的速度比轻量密码学和同态加密更加快速。但是区块链的交易速度与交易量仍有待改进。在安全性上,若单一黑客拥有系统50%以上的计算力,便能进行「51%攻击」,窜改区块链上的资讯,这部分疑虑仍有待研究。
原创文章,作者:惊蛰财经,如若转载,请注明出处:http://www.xmlm.net/bi/31818.html