微众银行区块链张开翔:区块链上隐私保护的挑战和应对

日前,微众银行区块链首席架构师张开翔做客香港人工智能与机器人学会 HKSAIR AI金融系列在线讲座,就“区块链隐私保护的挑战与对策”这一主题,就区块链如何为数据隐私和信息开放搭建一个平台,展开探讨。下面是雷锋网《AI金融评论》对张开翔演讲全文进行了原意整理:,我是微众银行的张开翔,我们团队从2015年开始研究区块链。说到区块链和隐私保护,首先简单介绍一下区块链的概念和分类。第一,真正的区块链必须基于分布式网络。数据块是有序列号、有高度的,每个数据块又是相互依存产生的,这样可以做到数据的严格校验,不丢失,不乱。再次利用密码技术来检查数据的稳定性,可靠性,完整性。以下两层加在一起更类似于分布式数据库或分布式网络。业界戏称,这是分布式数据库中最慢的一个。比如比特币的 TPS是7 (笔/秒),以太坊大约是10。事实上,我们的联盟链还是很快的,单链 TPS现在是2万左右。这涉及到性能优化这一主题。分布速度如此缓慢,它有什么价值?其价值在于,多方合作,区块链的灵魂和核心是什么?一致的,如果不能通过多方智能合约和共识算法来实现透明、高效、可信的合作,那就只是一个分布式数据库。那么多方合作的目的是什么?当然是资产交易,数据共享。基于智能合约的计算和数据共享规则透明,大家共同执行,这就是区块链。什么是区块链的基本特征?在介绍隐私保护之前,我们先来看看区块链是如何组织这些数据和规则的。第一,在每个节点中,数据结构都是相同的块。简而言之,每一个 block中包含一笔交易。每项交易都可能包含一笔资产转让,例如, a向 b转让100美元。该事务必须是事务,事务执行结果在所有节点上都是一致的,如何实现?也就是通过共识和数据同步,意味着所有的数据将被存储在链中的所有节点上。若链接到10个节点,则数据保存10份,一模一样;若节点为1万个,则数据保存1万份,同样一模一样,一个字节很好,不会丢失,说明所有人都可以看到,而且还可以验证数据。若有少数人篡改数据,其他人则可通过一致同意和确认拒绝修改,并在发现修改后惩罚篡改者。因此,区块链能够达到以下效果:第一,数据不易篡改,。换一种说法,则必须将计算力超过50%,或者与链上所有或大部分共识记账节点串联,仍然可以进行篡改,但这是很困难的,几乎不可能实现的。其次,规则是透明的,由于在所有列的节点上智能合约都是相同的虚拟机和代码,因此对于相同的输入,运行结果肯定是相同的,而且是可验证的。三是…追溯性,因为每个人都有所有的数据,并且这些数据包含了block0到 block最近的高度,这就意味着它们是可跟踪的。由于上述原因,从而形成了区块链的最重要特征——信任。但任何事物都有两个方面。提到区块链上的隐私问题,你首先要明确什么是隐私?您的个人资料及资料是保密的:除了您有多少财产,银行存款,不动产等等,还包括您跟谁交易,即银行流水,本人已递交出国签证,需附上近半年的银行流水及纳税记录。那时,我感到惊讶和难以接受,我认为这些交易关系是我的个人资料。通过流水中的交易信息,可以分析出交易的时间,地点,交易对象,常用的交易方式是零售还是转账,这就是你的行为模式。如今所谓的大数据营销,更多的是建立在你的身份、资产所有权、交易关系、交易频率、行为模式等信息基础上,为你描绘用户画像,分析你的习惯偏好。另外一个是在商业场景中比较常见的大容量数据文件。例如刷屏会留下视频,签合同会留下 PDF文件,大量的用户行为会产生一堆大数据集,这些实际上都是隐私,个人数据,商业数据。因此,隐私是立体的,它包含了许多维度,各种场景、时间、行为都会产生隐私数据。那么,如何表达区块链上的隐私呢?在此之前,所有人都说比特币和以太坊本来就是隐私,但是它的隐私基础在于匿名,以比特币为载体的转账,使用的是一个私钥和私钥生成的地址,没有用户联系电话、真实姓名、邮箱等个人信息,大家看到的是一串密码串。在此之前,没有人知道比特币网络的创始人中本聪是谁。这听上去是个成功的隐私保护计划。但如果你不小心保存了私钥,或者自己将地址公布到某个论坛,让其他人给你转钱,这意味着这个地址与你的论坛账户绑定。假如您在某交易所登陆,需要用您的个人手机号注册,上传身份证,然后您的地址就会与您的身份绑定;或者通过反洗钱和打击恐怖主义融资策略——总之,您可以使用一些方法,使您的账户与您的个人身份挂钩。就技术手段而言, IP映射意味着无论你在哪台计算机上,发送的是哪种通信包,只要能够抓包,就可以分析包中的大量信息,映射到你这台电脑上,获得你的帐号、地址等等。社会工作者分析也可以根据你在论坛上的行为,个人朋友关系,移动账户的交易关系来追踪。如上图所示,只要资金转移,就有联系网络,并且可以公开跟踪,区块链的特点是透明、共享、可跟踪、广泛参与:,透明,意味着扩大信息暴露的维度;共享,意味着增加数据存储的位置,使所有节点都能存储数据;可追溯,意味着隐私数据存储可能是永久的,不是存储一段时间后删除或删除,延长隐私存储的时间,就难以忘记;广泛参与,是说区块链作为一个分布式网络,一定会形成共识,此时,参与的网络可能存在一些不足之处,而开放的网络环境中更容易掺杂非信任角色,因此,联盟链在这一点上会好一些。因此,区块链实际上对隐私提出了更大的挑战。有人说区块链大量使用了密码学,因此可以被信任验证,但实际上这里的因果关系要替换一下,是因为区块链本身追求的是公开透明,为了在公开透明的基础上获得信任与验证,需要引入更多的密码学算法。上班时,我们会遇到很多灵魂拷问:,作为一家金融机构,每天的交易信息是否透明?怎样才能使链路上的数据可验证,但不可见,更不会被盗?上链后的数据,能删掉吗?是否加密的数据会被暴力破解?现均采用椭圆曲线, RSA算法,对称不对称加密,以长密钥保护数据。在数学理论上,这些都可以保证数据的安全性,但是在量子计算之后又该如何呢?…,个人认为,量子计算技术成熟到应用可能还没有那么快,目前看来,量子计算的形式能够交换密钥,但是想要处理和破解大量数据还是比较困难的。但对于金融行业而言,如果数据保存了2到30年,甚至是永久保存,即使使用长的密钥加密,其链上的数据也可能被破解。从父亲那里破解数据,影响儿子,影响几代人,(这一现象)在理论上存在。自然,密码保护和攻击的两个阵营,是呈交叉螺旋上升的:你有矛,我有盾,只是看看哪一个更难,哪一个更难,要花多少代价来保护数据。财务典型场景一:风控,假设一个由多个机构共同参与的借贷服务,这些机构联合为借款人提供资格证明和资金,这意味着这些机构将对用户的信用进行投票,决定贷款利率等等。但是金融有独立的风控权要求,即 a机构和 b机构的规则应相互独立,各自运作,如果只有一套规则,而且完全透明,那么就有可能被猜测,它也涉及到用户的隐私,例如,用户在 a机构中的交易数据不应直接交给 b机构,而 a机构和 b机构都应根据他们自己的数据和资料来判断用户。这就是隐私保护。信用管理与风控有相似之处,但其区别在于信用管理要使用大量、多维的有效数据,涉及社会保障、银行、税务等多个部门。如何将不同维度、不同机构的数据联系起来,整理出风控模型,这自然让人联想到联邦学习。财务典型场景二:资产流转,下图左边显示的场景与二级市场相似:有发行,有代理销售,代理人 a不想让代理人 b知道自己的代理情况,用户不想让别人知道自己购买和出售的情况,这是个人账户资产的变化,属于隐私信息。如今的确有许多隐私保护策略,如零知识证明、安全多方计算、可信硬件环境、全同态密文计算等等,以及相关的规范标准,这样的隐私保护是否就可以完全实现?笔者认为,每一种隐私权保护策略都各有特点,各有其短处,其长度可以体现在工作表现、功能、复杂性和集中程度上,零知识证明和安全多方计算上,这就是隐私权保护的核心,潜力巨大。但是它也有局限性,比如零知识证明侧重于证明某事物,有效性,而不是操作,但是用户账户,风控模型都与计算有关。安全性多方计算是,可用于,联合计算

但目前正处于由两方向多方发展的阶段,解决多方安全性问题比较困难,涉及成本、计算量、复杂性等。众所周知,手机拥有一个安全区域,将密钥保护在此可以减少安全风险,但是一个大型企业在这个区域中保护成千上万的数据,就等于完全依赖它。安全性软件和硬件仍然会有漏洞,还是要及时升级,总体来说,依赖于硬件系统的响应会比较缓慢。同态,很有意思,两个密文相加得到一个密文,密文解密后,就是两个密文对应明文相加的结果。可用于多种情况下计算帐目,但只能计算,难以验证,即计算结果如有误,在密文情况下无法得知。此外,同态一般用于加法计算,乘法计算速度较慢。此外,如果同态数据量较大,则其数据膨胀和运算速度减慢将十分明显。群组/环签名

它很轻而且性能很好,但是主要是针对身份,不是针对数据。规范性与标准性,依赖于许多外部管理手段,如处罚、司法追究等。将这些方法综合起来,我们将在性能、功能、复杂性和中心化上取得平衡,并在不同的情况下扬长避短,以达到成本和效果的最佳。那么就需要考虑多方面的隐私保护,这是一个立体的场景化问题,身份、资产、交易,这些都是我们要保护的基本信息。第一,这个信息是可见的吗?即使是接触不到数据,也没有办法用这些数据做任何事。第二,能看见以后,我们,能用吗,?若所见是一串密文,则不可用,也可采用混淆、脱敏等手段,以保证该信息的不完整。举例来说,有账户信息,但没有身份信息,因此不能使用。例如,密码学有一个密码信封,只有密钥信封可以打开。也可以采用多种方法,如一次一密假名,防止关联,这样就不能对用户进行画像,外界所能看到的只是孤立的数据,无法对用户做什么。最终,你所看到的数据会不会受到控制,所谓对数据的控制,就是你将我的账户转移给其他人,改变我的属性,我要做权限控制,做安全加密的策略和,多方制衡。如前所述,区块链有一个特点:如果你改变数据,别人不同意,共识算法不通过,我有拜占庭容错机制,这是多方制衡机制。有几个效果:看不见的数据,不知道的数据,不能改变的数据,但是在区块链上仍然可以被验证,可以管理。联盟链的特点就是——可管理、合法合规,这些要求涵盖链的整个生命周期,包括收集、传送、储存、使用、屏蔽、销毁等。每个阶段的生命周期都有不同的特点,环境也牵涉到网络、存储、内存计算和云端,需要用不同的技术手段来应对。因此我们的整个布局仍然非常繁杂,图的底部是各种各样的隐私技术,这些技术并非一两个算法、密码承诺或简单的随便传输就能覆盖到,联盟链治理,联盟链与公链最大的不同之处在于,联盟链拥有、进入机制。访问联盟链的所有人员、机构、节点、身份均已知,接入前需向运营委员会申请,该委员会具有多中心性质,不是单一的。若您同意您加入此链,则可向您分配证书,公私密钥,以便访问此链。通过启动连接的方式。假如某人或节点的链条上有恶意行为,委员会也可以将其开除。分离,当机构从事业务时,就有可能与不同的人进行交易,作为机构,就会希望这些人中没有交集,这样,同业的倾轧,数据泄漏等就不会发生。公司研发的底层平台采用群组架构,即在区块链上提取局部共识的独立账本。在一个群体中,信息是相互隔离的,可以扩展群,也就是说,可以建立无数的群,覆盖无数的业务,这在性能,功能上都是非常有利的。对于不同群体、不同链上的不同信息,需要相互验证、打通,走跨链路径,这种技术安全可控。分离角色

首先要明确的是,不同的人做不同的事。一个术语叫 DO分离,是指开发和操作分离,开发无法完成操作,操作无法完成代码。再进一步说,就是建造、管理和使用是分开的,避免一个角色,既当裁判又当运动员,以免他触碰到过多的数据,可能会侵犯隐私,这就是整个联盟链的角色分层概念。刚刚提到了节点,人,权限隔离,再看看数据隔离,。常有人问我这样一个问题:要传输一个文件,是否可以上链共享,但同时上链后又不让所有人都看到?此时,文件就可以加密了,重新上链。此外,还可以使用文件不需要上链,链上存储着一些身份或 URL,一些散列,这些散列相当于文件的指纹。链上结合:链上建立哈希指纹,链下传输文件,用户可以在链上获得文件。

提示:如果您觉得本文不错,请点击分享给您的好友!谢谢
相关推荐
新闻聚焦
猜你喜欢
热门推荐
 
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。