吴文俊人工智能科学技术奖
工业互联网与智能制造

《面向未来构建云边协同的大数据平台》

2021年05月20日   来源:中国人工智能学会     

8078


2021年4月10日-12日,吴文俊人工智能科学技术奖十周年颁奖盛典暨2020中国人工智能产业年会在北京和苏州同期圆满成功举办。矩阵起源(Matrix Origin)创始人CEO王龙受邀在苏州工业园区希尔顿酒店,2020中国人工智能产业年会—工业互联网与智能制造专题论坛上发表主题报告《面向未来构建云边协同的大数据平台》。


以下为演讲实录:


感谢主办方邀请,我这已经是第二次参加本论坛上一次参加时我还是腾讯云的副总裁,负责腾讯云的大数据和人工智能业务。我是年初的时候决定离开腾讯,创办一家新的公司。我为什么要创办这个公司呢?和今天的论坛主题是分不开的。因为在腾讯的几年时间里,我带领我的团队落地了不少和智能制造以及工业互联网相关的项目,比如像华星光电、工业富联、三一重工等。落地的过程中遇到了非常多的挑战和问题。我们的项目有的很成功,有的就不那么顺利,在落地过程中都距离期望相差甚远。例如我们参与的一个质检项目,用深度学习来做质量检测,我们的投入差不多在30人,投入了一年,替换掉了大约不到50个人的检测人工。我们都知道是生产线的工人,他的成本是多少?不到10万。用平均成本高达近100万的团队,来替换一个50多人的一个团队是不划算的,从经济学的角度是不划算的。由此我就在反思,我们虽然在工业里看到了很多信息化智能化的机会,也确定能用大数据人工智能来解决很多问题,为什么到现在还没有铺开呢?这背后一定还有本质性的问题没有克服。我创办这家公司,就是试图从源头来解决这样的问题,所以我公司的名称叫矩阵起源。



进入今天的正题,我们先来捋一捋几个概念。我之前在腾讯的时候,包括Pony马化腾在内,一直在讲消费互联网的红利已经结束,下20年主战场在产业互联网。我们也看到各种行业分析报告里都在提数字孪生,工业互联网,工业4.0等等各种新的理念。这代表什么意义呢?在我看来这是传统企业信息化、网络化、智能化必然趋势。


产业互联网说的是如何把互联网技术应用到产业当中去。这个产业不仅是制造业和工业,还要链接从原料到生产到物流到消费到反馈的整个流程,以及围绕这个流程的所有人和设备。通过这种链接来降本增效,并有可能创造新的商业模式。


还有就是国外讲的最多的是数字孪生,他的含义在我看来和工业互联网以及产业互联网是有很多重叠的。把物理世界里的各个数据,各个节点,不管是流程上的,还是人员上的,把它更好的数字化以后,放到数字化世界里去进行模拟,进行仿真,再反过来回馈作用于物理世界,提升人类的生产和消费活动的效率。


当然现在不管是中国还是美国都已经意识到工业和制造业的重要性,工业和制造业的核心竞争力之一就是智能化的程度,这些概念都将会提升智能化的水平。



那么这些概念的提出代表什么趋势呢?


第一,未来服务制造和工业的所有软件应用要更加灵活。我们可能觉得现在获取软件和软件服务已经很灵活了,手机上有各种各样的APP,互联网上有各种各样的SaaS,但在未来它是远远不够的。工厂的设备控制,流程的自动化,还有各种决策,它是千变万化的,可能每一个节点都需要一个“定制化”的软件服务,远比现在手机里面这些APP交互要更复杂。


第二,未来服务制造和工业的所有软件应用要更实时。现在我们和数字世界的大多数交互是可以忍受延时的。发一个微信过去,可以忍受3到5分钟才收到回复。我们看视频缓冲个3、5秒,问题都不大,可是在无人驾驶和工业控制机器人的运行过程中,这个不确定的延时就是要命的。


第三,未来服务制造和工业的所有软件应用开发部署运维要更有效率。我们都知道刚才邱教授说了工厂的利润率只有2%。那么当应用不够灵活,不够实时的时候,拿多少钱出来做技术改造是合适的呢?企业一定是寻找性价比最高的,包括高效利用人力、基础设施以及各种各样的其他资源。国家新基建的很多投入,如果我们去思考背后的逻辑,其实是要要解决未来工业产业的信息化基础设施需求。



我们再看看近些年IT基础设施的变化。


第一,边缘节点。运营商、电网公司和工业园区都在在建设边缘机房,把算力带到设备里面去也是行业共,5G在大规模商用化以后,必然降低设备接入的成本。


第二,异构芯片。讨论算力性价比的时候,性能之外的两个重要因素,一个是价格,另一个就是耗电。为了满足不同场景,不同环境的诉求,各种非x86、非GPU的异构芯片层出不穷。我们知道从经济学的角度来看,满足特定场景需求的专用芯片,它的性能、成本或者效率往往是最优的。


第三、云边端一体化。这些年很多厂商已经提出了云边端一体化的概念。边缘计算、异构芯片、5G的发展,使得算力资源,数据存储分布在从端到云这个链路各个节点上。云边端一体化的调度和管理,才能够充分的利用这些资源,为同样分布在这些节点上的软件应用服务。


如果仔细分析这些基础设施的变化,我们会发现,它们恰好应对了未来制造和工业软件应用的诉求。


新的软件应用趋势、新的基础设施

需要新中间技术层链接



21世纪头10年,当应用从私有化服务器和数据中心迁移到云端的时,最开始是简单的操作系统虚拟化,例如KVM、Xen、Hyper-V和ESX,紧接着就出现了存储虚拟化、数据库虚拟化、中间件虚拟化,再然后就进化到了最近几年的容器、Serverless无服务计算等等。其本质是云计算改变了数字世界基础设施,云服务改变了软件应用的的开发交付模式,那么就需要新的中间层来充分利用新基础设施,支撑和服务新的软件应用。


前面两位老师说了数据是未来数字化智能化的最重要的燃料,基于这些数据我们才能有各种各样的创新,提供各种各样的方式来帮助企业实现智能化。


当基础设施再一次演化的时候,当软件应用的开发交付模式再一次创新的时候,我们需要什么样的数据平台来链接基础设施和上层应用呢?这就是矩阵起源公司需要去研究和回答的核心命题。


我们要做一个新型的数据平台,那么必定要了解新的大数据的特点,以及使用者的痛点和诉求。


这里有个非精确量化的总结。和传统的互联网大数据相比,一个典型工业大数据平台支撑的数据类型都是超过10,数据规模也是传统互联网的100倍。如果考虑到智能制造和工业互联网的高速发展,这个数据规模将会是几何级数的增长。


比如说某制造业每条生产线当前每天产生的数据是100GB,如果做智能化改造再翻倍到200GB,这个工厂大概有800-1500条生产线,这样的话每天的数据存下来就是200TB。要做到追踪溯源、智能排产、库存管理等的全面智能化,存一年的数据就是70PB,光硬件成本就高达数亿。再加上大数据和人工智能的相关人才都比较贵,工厂也很难招聘和留住运维和数据应用的人才。


如果再考虑到大数据和人工智能应用的实时性需求,和模型训练、推理的资源消耗,挖掘这些数据的投资回报就会低得可怜。所以很多工厂会抛弃7天前甚至1天前的历史数据,更无余钱考虑信息化和智能化的改造。


我认为这些挑战毫无疑问是巨大的,而且是长期存在的。要帮助智能制造和工业互联网应对这些挑战,在座的各位专家学者,各位从业者毫无疑问会发挥重大的作用。而我们公司则是希望从更基础、更源头的角度考虑,如何给各位打造一件趁手的工具,让大家能够N分之一成本、N倍性能、N倍效率的在数据中挖掘价值。


N分之一的成本和N倍的性能

来自对于基础设施的充分利用


企业和工厂在过去这些年的信息化进展中,已经购买和部署了各种各样的计算存储资源。当新部署一套大数据系统的时候,可能70%都是采购新的硬件。而这么大规模的数据量,又让他们无法全面的使用公有云。如果有一个数据平台,一方面能够在结合公有云的基础上,充分利用各种边缘计算数据中心的资源,另一方面能够支持异构芯片和服务器,可以帮助企业利旧, 那么就能达到成本的最优化。同时如果还可以精准的调度和匹配数据与计算资源,那么自然就可以实现性能的最大化。


N倍效率来自于数据应用开发的易用性


做智能化改造,一定需要一个统一的数据管理,将这些烟囱里的数据整合起来,就是所谓的数据中台。但这还远远不够,因为根据数据分析来做的各种决策,要分钟级甚至秒级准实时反馈到很多条生产线上。这就需要能够快速的将不断大规模产生的数据,快速的整合到统一的数据平台做模型训练、更新和推理。


现在一些工厂大数据系统,系统架构非常复杂。ERP、CRM、WMS、APS、MES、MM等等各种烟囱式的应用,导致一方面数据及其分散,另一方面数据的存储机制会更多的照顾事务处理(Transaction Processing),导致其分析型任务(AnalyticalProcessing)性能被牺牲掉了,而我们都知道分析型任务是智能化的基础。同时,新型物联网数据又以非结构化、半结构化为主,尤其视频音频又是AI的重要原料,把这些数据的存储和处理过程融合进已有系统,又成了一个艰巨任务。矩阵起源的思路是从烟囱底部解决这个问题,重新思考并统一整合数据的存储和分析过程,从而简化数据的处理线路,提升数据的实时处理能力。


N倍效率还来自于生态和人才的丰富度


现在的基础技术越来越复杂,想要掌握一门新技术,学习的时间越来越长,难度也越来越大,而缺乏上层的软件应用生态,也导致企业使用新应用的成本效率都非常不理想,这也是国内目前基础软件很难推广的原因之一。我认为解决这两个问题,必须要开源。开源意味着长期坚持,也意味着企业间的开放协作,同时也是为行业最快速培养人才的最佳土壤。


当然,即使有了这些路径和方法,要实现N倍效率、N倍性能、N分之一成本依然是难度非常大的。但我们相信智能制造和工业互联网,从信息化、自动化到智能化联网是必定要实现的,这关系到国家的制造强国战略,也关系到未来行业的竞争力、关系到终端消费者生活水平的提高空间。这坚定了我们团队在这里长期投入的决心,并把解决这些难题作为我们的最高目标。


结合上面这些思考,矩阵起源汇聚业界顶级的科学家和工程师来解决这些问题,希望能够打造一个创新的大数据平台产品,预计会在7-8月份会出第一个版本,并从一开始就将其开放给社区。

矩阵起源会坚定开源这个路线不动摇,期望和在座的各位在这个领域里一起长期深耕,为智能制造和工业互联网的建设,为全行业的数字化转型和智能化升级做出贡献。

组织机构

主管单位
中华人民共和国科学技术部
国家科学技术奖励工作办公室
主办单位
中国人工智能学会

奖励资质