原文标题:《火花访谈:区块链中的复杂系统》
本文作者万红教授,2004 年开始在普渡大学担任工业工程学院做应用数学和复杂系统优化的教授,主要研究方向是 simulation,偏重于做仿真实验设计。现在主要关注如何把区块链作为一个复杂系统,并试图用智能体仿真模型来演绎区块链网络经济的演化。万红教授本科就读于北大化学系,辅修经济。后在美国西北大学攻读材料学硕士和工业工程系博士。
问 :请问您是怎么理解复杂系统呢?
答 :不同的人对复杂系统有不同的理解,我主要从模拟的角度来理解复杂系统。
第一是从蒙特卡罗模拟的角度来研究。比如说有一个 excel,这里面有很多函数关系,你就可以做一个很复杂的计算,把随机数放进去,每次得出的结果实际上是不一样的。蒙特卡罗模拟在金融上的应用比较多,因为你需要分析它不同的情况。
第二是从离散事件模拟的角度来研究。比如你设想一个 factory,里面有各种各样的 machine, 每个 machine 都有相应的处理时间,里面的 order 也是不确定的,这个时候它是一个以 queuing theory 为基础的这个系统。这个 factory 最大的优点是有不确定的 order,不同的 order 进来这个系统后,你需要开始统筹规划:每个 station 要放几个工人?放几台 machine?工人要不要 cross training,即可以在这个 station 干,也可以在那个 station 干?怎么优化库存?怎么优化供应链?怎么做到需求生产?就像戴尔当年的崛起一样。
这个系统最关键的,一是有一个明确的起始和结束,比如说每天这个商店从早上八点,开到晚上九点;二是 study state analysis,即这个系统一直处于学习状态。比如说我们用的网络,这实际上是一个连续不断的系统。这个系统会有波动,inpidual 的 observtion 也不确定,但是它的幂和整体的分布实际上是稳定在一个程度了。
从我个人角度来看,复杂系统最特殊的在于它会进化。复杂系统没有稳定状态,可能一个个体就会引发一个世界的变化,整个系统的平衡随时会被打破,这里面就会有很多有意思的问题。
一个是你怎么定义这个“变化”?你怎么确定这个变化会改变整个系统?另一个是什么东西会触发这个系统,并发生什么样的变化?怎么来做这个模型?这个模型里有独立变量和因变量,那么前者对后者有什么样的影响?这个系统究竟是否可以预测?
在复杂系统模型里这是不可以的,因为它有个引爆点,一旦过了这个引爆点,整个系统的机制可能就会发生变化。那么这个问题就变成了什么时候是引爆点?然后如何来研究?很多时候你需要知道系统正在发生的变化,所以你要去 monitor,并且后面采取新的举措。
离散事件模拟和蒙特卡罗模拟基本都是从上向下的,先看数据是如何分布的,再确定随机模型,然后设立一系列假设来搭建这个模型。
但是用 ABS model 来研究复杂系统,是正好相反的,它是你决定里面有哪些 agent。比如在区块链中,每一个矿工,每一次验证,它就是一个 player。接着你要考虑它有什么样的实用功能,这个功能对不同的人来说可能是不一样的。假如每个人都想优化自己的收益,那么应该加入联盟和大家一起做到最后呢,还是单打独斗的做下去。你用什么样的机制可以激励大家来保证公平呢?
这是区块链里面很重要的一个原则,另外就是能避免垄断。在这种情况下,你是很难对整体有一个特别清楚的思路,你更多知道的实际上是 inpidual player 的,你把它放进去,然后 inpidual player 之间做各种各样的 interaction,你去观察这个系统的进化,这是非常不一样的。
拿社交网络中 Information 是怎么来运转举例,现在社交网络里面存在一些影响力比较大的用户,他们影响力是很大的。这些人 Information 的传播,和其它普通用户是完全不一样的,所以这是复杂系统本身不一样的地方。
此外,网络是会不断演化的。比如一些有影响力的玩家发了一条消息,熟人的熟人可能变成你的熟人,那么你和他就会有直接的连接 , 这是一个基于人脉的动态网络。但在选举过程中,一些政治倾向特别强的人,可能会冒犯到他的用户,但是会吸引和他有相同倾向的人。这个时候他就变成了整个网络的一个节点,网络就不是基于一个人际的东西了,而是一个 opinion based 的网络。
问 :您为什么会转向复杂系统的研究?
答 :现在的复杂系统越来越多了。用简单的 steady state 跟不上形势。做区块链研究用简单的离散事件模拟很难 model 系统的 dynamic,steady state 系统现在也越来越少了。我同时也在从事博弈论的研究,不管是从提高社会福利,还是个体纳什均衡的角度,如果不从复杂系统的角度去做,很多东西是难以构建模型的。就算有很好的分析结果,都会存在很多假设导致这些结果在现实世界中难以实现。
我们要建立一个 ABSM 的开源平台,希望最终可以帮助大家来测试共识算法的表现。 这个平台应该是由一个一个小模块组成的,由用户自己去搭建。区块链有很多的数据,但是还没有什么特别好的分析,所以现在我们想根据现有的爬虫去抓数据,看是否可以发现一些 insights。
另外这些数据可以帮助我们构建 ABSM。在博弈论里面,有很多研究是关于人在什么情况会有什么样的行为。那么在 ABSM 里,会把一些随机或者非理性的东西放到模型里面,以期更加接近现实。比如金融市场里面的理性人假设,在现实中是不成立的。
我们利用数据,去做一个可以模拟人们行为的模型,这是验证步骤,接着我们就可以做一些实验了。比如我们会放出一条消息,根据人们的反应,得出不同人群的比例会对市场造成什么影响。在区块链领域,我们希望用模拟来做策略分析或者风险分析。
问:您觉得目前研究的难点是什么?
答:第一个就是从团队的组建来说,现在挺难找到统计和编码都很厉害的人,所以很多事情我还要亲自去做。另外一个就是,ABSM 里 agent design 很重要。也就是说这个 agent 对什么东西有 respond,怎么样改变它的 behaviour。从区块链的角度来说,这个 behaviour 怎么来设计是现在的一个痛点,同时我也和统计系的同事正在研究,怎么设计 agent 使得它有学习能力。
原来很多的 ABSM 都是非常虚设的,也就是说遇见一件事情,它就做一个决策,实际上就是基于一个很简单的 possibility model。但是我们希望做的这个模型实际上是有点类似于马尔可夫模型,这个模型可以根据我现在的状态,学习周围的环境,使这个 agent 更加智能。同时这个决策实际上又要基于博弈论的角度来做,因为每个人都要使自己效益最优化,所以把这三方面结合到一起其实挺难的,这个 agent 确实能模拟真实情况。
第二就是说对区块链本身这个系统非常了解的人现在还不多。我们现在希望能够更多的了解一下区块链系统,使得搭建出来的模型更加合理。如果你查一下这个 AB,它有很多博弈论和网络的单独模拟,但是这么一个复杂系统,无论是从编码还是后面的分析,我觉得都还是一个挺大的挑战。
问:那您这个研究在未来可能会有哪些更细分的课题呢?
答:一是 smart agent 的设计,数据库输入建模,然后 agent 是会随着更多的数据进化的。二是我们想做一个分析,看区块链市场和对新闻反应之间的联系。现在我们是从大数据的角度来做的,三是我们现在开展的一个研究,实际上是想做一个 multi-stage game theory 的基于代理模型。因为区块链里面的人都是长期 play 的,他投资买了矿机以后实际上是需要矿的,还有的人他只是做 validation 来收交易费。那么如何来搭建这个系统?
我有一个学生正在研究根据现有的各种假设,解决一个利益优化的问题,使我知道怎么把计算机资源分配到各种币上。并且信息是不断变化的,那么这种情况下根据它价格的不同,它已经被挖出多少了,还剩多少资源,我们假设就把它变成一个回报的变化,我怎么来预测这个变化?其次有些变化它回报可能很大,但它的这个成本同样也很大,这个框架策略怎么来动态更新?
这里面其实就成为优化策略设计的一个问题了,这里面有很多原来在金融方面的研究,同时也有很多在资源配置和设计上研究。它本质上是一个优化组合的问题,但是这个优化组合非常复杂。
首先它肯定是一个大规模优化,我原来一直在做学习方面的特征选择,有那么多的影响因子,我到底选哪些作为我的关注点,比如说怎么识别关键用户,怎么识别关键因素。如果能把这个问题简化成一个只有 5 到 6 个 key factor 的情况下,就很容易做出决策模型,但如果你给我 1200 个 factor,是很难做优化的。
特征选择如果要说的更具体一点的话,我们就是在 lasso 或者 ridge regression 这样的方法来看这个,其中有个 subtopic,我们正在做的就是怎么把这个 lasso feature selection 放到神经网络里面去。
问 :如何将 feature selection 放到 machine learning 里面去呢?
答 :feature selection 包括 lasso 大部分都是一步性的,你有很多的数据来做一个分析,现在的 trend 的实际上我们也在做。怎么把这个东西放到神经网络这部分去,这里面会有一些问题。深度学习实际上是多级的,包括这个马尔可夫随机树这些东西,而且它不停的有新数据进来,那这种情况下的 feature selection 怎么能变成一个 adaptive multistage,前面的数据怎么能尽可能用到这里。而做模拟的一个独特的地方,就是说我可以设计我要从哪里拿到数据。
区块链最大的好处就是你能从各个层面拿到数据,同时保证这个数据的 validity。如果你有 validator 同时还有匿名性。我不用让你知道我是谁。那么深入学习能和区块链结合起来,这是非常有前景的。
在现在这个情况下,对我最大的挑战是要找到一个 focusing 的 area 然后在这个上面做出来。我现在特别 focus 的就是两个方向,一个就是把 ABSM 和区块链结合起来,因为这个对业界会是有帮助的,另外就是对教育会很有帮助,你可以想象看它这个系统的运作是怎么样的。比如说 ABSM 对社会网络的研究有贡献,所以我希望对 blockchain 的研究也能做贡献。现在泡沫基本都被打掉了,就是做研究的好时候。
还有就是深入学习这方面的研究,因为区块链如果没有大数据,注意数据不是存在区块链的,它只是给你一个数据的地址。它能让你 retrieve back,但是没有大量的数据,区块链就没有很大意义。如果你有大量的数据,你总是需要这个学习方法,不管是 supervised 还是 unsupervised,数据要有意义。所以我很希望在这个领域能有学者来做出贡献。
另外一点,我想尽可能的帮助业界来解决他们真正想应用区块链的痛点,因为现在讲区块链应用的大部分是浮在表面上。我不是说这编码的细节,现在能做编码的人也很多。但实际上你要从系统角度去设计它。比如 Amazon 为什么那么成功?就是因为它做的物流系统还有供应链物流系统,做的非常的成功。
那么区块链根据不同的用途,也需要一个系统设计。举个特别极端的例子,比如说健康护理,就完全不可能用 POW。因为如果这样的话,你就没有任何隐私可言了。对于研究机构的话,他如果能用区块链看到大量的匿名数据,对吧?那么就会显著促进研究的同时没有任何被骗风险。
现在很多人特别希望食品溯源,这就变成一个完全相反的问题。就是说我拿到餐桌这盘菜,我按一个键,通过区块链我就可以看到牛肉是从哪个农场来的,现在有没有记录我的 organic 是不是 organic,在这两个情况下可以想象设计完全不同。
当时在比特币最火的时候,我每天去开会。在开会的时候大家都在说这是未来,但是我就一直说,第一不是所有的地方都要有区块链,很多人是拿着答案去找问题,这是不对的;第二大家都说区块链最好的就是因为它是分布式的,它没有中央系统。但是在很大部分的无币应用场景,它实际上应该是一个混合系统,也就是说集中式和分散式系统的一个结合。
很多人现在把区块链就作为一个私人共享的数据库,因为它做这个非常有效,但是它没有任何 validation,我觉得这一点很值得思考。比特币本身就设想每个人都想占其他人的便宜,POW 本身就是基于这个。它那么大的资源消耗,就是因为我假设所有人都要害我,所有人都要占我便宜。POS 又是假设我们完全可以相信群组里面掌握最多资源的人,或者是其它的 stakers。
那么对一个系统的研究,就是根据不同的信任水平,在有些情况下就需要有中央系统。在另外一些情况下你就算是用区块链的话,你假设他们之间有一些信任,比如在同一个组织工作,或者是他们有不同的利益共同体的话,那么实际上就不需要 POW。你怎么把共识设计和信任等级组合起来,你又怎么设计混合系统,这是我一个长期想要达到的目标,也就是从 engineer 和 business 角度来设计这个应用的情况。
声明:本内容为作者独立观点,不代表 CoinVoice 立场,且不构成投资建议,请谨慎对待,如需报道或加入交流群,请联系微信:VOICE-V。
简介:X-Order是一家致力于发现拓展秩序的研究机构。 我们通过演化和复杂系统的视角研究拓展秩序,希望成为链接新经济与跨领域科学研究之间的桥梁
评论0条