吴文俊人工智能科学技术奖
青年科学家
首页 > 青年科学家 > 正文

《天地一体化网络资源智能协同与优化》

2021年05月20日   来源:中国人工智能学会     

9114


2021年4月10日-12日,吴文俊人工智能科学技术奖十周年颁奖盛典暨2020中国人工智能产业年会在北京和苏州同期圆满成功举办。清华大学电子工程系博士后杜军受邀在苏州工业园区希尔顿酒店,2020中国人工智能产业年会—青年科学家前沿论坛上发表主题报告《空天地海一体化信息网络资源智能协同与优化》。


以下为演讲实录:


我的研究方向是天地一体化网络资源智能化协同优化,跟各位老师有所不同,但是我听下来收获非常大,包括刚才张萌老师介绍的电力系统的攻击、攻防内容,对我还是有很多学习和借鉴的地方。


我介绍一下我的研究工作,我研究的天地一体化网络,前期研究是基于博弈论,像张萌老师说的方法来做资源配置和协同优化,但是近年来随着智能化技术的引用,对网络组网性能的提升以及传统模型分析方法解决不了都有显著的优势,这两年我也是把智能化的技术引入到网络的组网优化当中。


我今天主要汇报四个方面,尽量把技术方面的东西弱化,之后介绍一下我研究的一体化异构网络组网关键技术,第三介绍智能化技术在组网优化中的应用,最后做一个总结和展望。


01

研究背景



我简单说一下空间信息网络是以天基平台,包括高中递归卫星包括临近空间平台和飞艇、气球和无人机,与地面网络一体化互联,可以支持海量数据实时传输分发,实现体系化信息应用的国家网络基础网络设施,也是国际关注的前沿领域。




天地一体化网络,随着5G和4G网络不断地革新带来了上网通信的速度越来越高,以及超低延迟的应用,以及百万甚至千万级物联网大规模的进入,5G带来这些方面巨大的变革,进一步发展覆盖是要解决的问题,包括深远海的覆盖还有边缘地区的盲区覆盖。


全球化的无缝覆盖刚好是空间信息网的独特优势。


我研究的着眼点就是星地融合网络,希望能够取长补短形成天、空、陆、海一体化的信息通信网络提供一个实现的途径。



目前在星地一体化融合方面,国际普遍共识,并且加速推进的,尤其是以美国为代表,2016年提出来由4000多颗星、7000多颗星,甚至2019年42000颗的全球卫星互联网计划,包括英国俄罗斯在相应的领域都做了部署,我国也是对天地一体化网络进行了虹云、鸿雁的规划。华为提出了1万颗小卫星飞行器的计划。



一体化网络里面的关键问题集中在9个方面,包括不同的网络元素的协同,不同的网络元素的接入,包括比较火的物联网、车联网以及移动性管理,就是无人机或者是汽车的接入,包括传统的卫星通信和地面的移动网络通信和物联网协议转换。


02

一体化异构网络组网关键技术


我的研究主要是在网络的存储计算以及通信资源的融合,这个也是九个关键问题中间的三个比较重要或者是核心的一些基础性的途径。未来的星地一体化网络必然通信存储计算资源深度融合的网络。



针对这些问题,通信计算存储这些问题,我简单介绍一体化网络组网中存在的关键问题,作为刚刚说的国家重要的基础设施,一体化网络资源高动态且异构,包括不同的链路以及节点,包括像不同节点的资源,和传统的卫星面向于定制化固定化业务不同,更偏向于差异化业务,包括遥测遥感、广播还有定位导航,差异化就意味着像我们通信要求带宽高,要定位导航,信息的准确度要高,不同的应用业务衡量的指标以及追求的目标都是不一样的。目前一体化网络里面突出的问题首先就是业务冲突高,数据显示我国的飞控中心申请天链中际的一颗星冲突率高达58%,这是非常严重的,比如说我们有10个任务,其中6个都是完成不了的。


比如说频谱资源很匮乏,目前全球移动通信是超过3G赫兹的。这种单位站功率消耗,对于功耗的能源非常紧张,其次就是干扰,频段的分配都会造成网络资源紧张的现状。


因此资源如何完成任务驱动的网络资源的管控,对于高效的异构资源配置和差异化的业务服务至关重要的。


所以我们前期的研究目标包括现在正在开展的目标主要围绕通信、存储、计算资源深度融合,希望对网络感知、管控、评估能力进行优化。



天上的飞机和陆地上的通信称它为子网,实现这种综合网络的管理,难点在于这个网络异构性、高动态性和业务的突发性,这个业务拓扑高动态、网络异构显著,卫星链路出现问题,在完成整个联合任务的时候,在地面、海上甚至无人飞机上面的通信同时都会来报警。这样一个网络规模下大家都在报警,故障的根源在真正地方,这个在数据非常海量,网络规模庞大的情况下很难发现,我们称之为看不清的问题。


其次是针对网络动态、跨域、随需资源统筹难题,网络在拓扑结构变化,面向不同的业务,联合来优化调度这个资源,支撑不同的通信带宽要求很高的并发业务同时支持,在网络的条件下非常难以实现的,我们称之为控不住的问题。


第三,网络评估,评估是在现在一直都会做网络评估,就是网络不同的单元收集网络日志,逐层上传,一周、一个月进行网络性能的评估,对网络进行一个维护。这个周期非常长,对于一些应急救援、联合救济的场景下,这种更新网络的力度无法满足这种需求,我们称之为评不准的问题。


总结的综合网络管理问题分成看不清、控不住、评不准。


针对这些问题我们开展了三部分的研究,包括对于看这块是做实时、准确的故障定位,2和3都是面对资源统筹问题对异构资源协作统筹,使网络的容量增大,延迟降低,并对不同业务的需求进行自适应,最后就是网络的态势预测和性能评估问题。


03

智能技术在组网优化中的应用


针对这三个问题,我们开展了一些研究,我重点介绍一些我们尝试使用一些智能化技术在这些看不清、控不住、评不准问题当中的应用。



首先是故障定位,故障定位张萌老师也介绍了攻击和网络直接的损毁造成的故障,传统有规则的离线方法,但是对于动态、异构来说,传统的方法很难满足需求。我们就提出来进行在线的检测故障搜索方法,难点在于什么呢?如果用高纬度搜索,这个业务也很多,问题出现的会非常多的情况下,高复杂度的搜索,时效性难以满足。低维度的搜索,把维度降低,用处理的方法,但是会导致网络中的耦合关联和动态信息丢失。


针对搜索空间问题,我们提出了分层诊断和梯度提升数的检测算法。


首先是通过骨干网的检测,通过特征提取进行门限判决,算是一个从高维向低维的,可以保证我们快速的定位在不同的子网中故障大概率发生在哪一个子网中,定位往子网以后,对子网进行检测,通过梯度提升的过程,对所有报警信息中相应子网的故障信息进行提取,把故障定位出来,实现看得准的效果。这是我们通过实际实现可以跟现有的方法的对比,在检测时效性和准确度方面都有了一些提升。


这个其实跟一些比较复杂的方法来比,时限比较简单,工程里面也能够支撑现有的需求,针对通信指显系统做了一个综合网络管理系统的研发,可以解决整个的网络的监控监视难题,也对之前天宫和神舟任务执行提供了重要保障。



第二部分资源协作是我们工作的重点,最终的目标都是为了优化资源配置控这部分的,我们前期的研究,包括我个人还是基于博弈论的方法,博弈论经济学当中出来的,对于交互式的决策过程,包括自由策略的生成都有好的性能,在通讯组网中,有非常多的学者有了非常多的应用。这个是比较经典的理论,相对来说都是大家比较熟悉的。


我自己的理解,博弈论虽然是出现在经济学当中的,但是对于通信和电力现实的网络系统是更加适用的,在经济学里面,作为参与者的人不可能是完全理性的,但是对于一个系统中你规定好这个机器的规则和准则,是完全理性的执行训练和决策的。


博弈论虽然是比较早的理论,但是这些思想和博弈双方,包括重复博弈、动态博弈不断地决策过程中双方不断地优化各自的博弈,最后达到一个稳态,这个也跟我今年来接触来学习算法的思想有异曲同工之处的。


我们在基于博弈论的方法主要是对网络中异构资源的提供方、需求方,提供方就是资源本身,需求方就是不同的用户、业务,是有非常好的建模能力的,比如说在决策执行过程中,可以随着环境、状态的变化,不同的资源提供双方决就会相应的变化,这是比较形象的比喻。


另外当激励因素变化的时候,比如说资源充足和不充足的时候,双方对资源的评价是不一样的,表现出来的决策是不一样的。另外就是资源不对称,对资源的视角不同,收益函数不同,所以提供方肯定希望以有限的资源获得收益,这个需求方希望最小的代价获得更多的资源满足我的服务。在之前的研究中,针对实际通信资源统筹中对环境不同因素的变化和信息不对称的问题开展了研究,包括基于演化博弈的共享方法,最后两个其实是动态的过程,就是博弈双方,会根据网络对方的决策以及网络状态的变化,包括能量或者是信道条件的变化不断地更新自己的策略,最后达到一个稳态系统中大家都能够双赢的最大化效用的稳态。


随着网络规模的扩大,业务的增多,尤其是地面空间一体化网络,大家提出来需求的情况下,其实传统的分析方法有一些途径,对于数据分析的效率非常低,这中间相互的影响作用关系,传统模型的方法很难建模相互耦合复杂的关系,对于数据分析和业务服务信息收集和网络状态的收集,实现对业务和网络特征的分析,以及网络管控方面,比如基于业务特性、网络特性,是按需分配还是按等级分配,这个都对智能化提出了更高的要求。


近两年我们也是基于强化学习和深度强化学习的方法应用到了网络资源配置当中,通过信道的选择、功率控制、频谱、计算、存储共享进行训练,分配的能力和服务的时效性、吞吐量、业务自适应能力都有提高。


问题在于我们发现在实际的资源分配里面,通常离散决策与连续决策共存问题,车联网里面有一辆车有路况的信息、地图信息和周围车况的信息,需要一些无人导航的决策要做的时候,这种处理的能力,可能本地处理不了,把这些技术卸载,也建了路边基站提供边缘卸载的资源。但是车在行驶过程中,究竟接入到哪一个基站呢?我选择A还是选择B,选择完以后到底卸载多少任务到这个地方去?这是连续的,是卸载50%还是60%,这其实多决策的,离散连续共存的问题。我们这块的工作也是做了试探性的探索,对于资源选择使用连续的空间,资源分配是用连续的建模,基于DIL做了计算资源的分配,网络里面有的资源可以进行能量捕获,有的资源是可以重复利用,有的是一次性分配完再也没有了多种资源进行了联合优化的控制,也是得到了比较好的效果,在平均的网络,我们叫收益,包括资源的利用率和服务能力方面。


目前我们主要集中在集中式训练/决策,数据非常大的情况下,时效性肯定是相互矛盾的,目前的想法就是通过分布式的训练,就是训练的数据都是局部的,上传到综合网管只是训练的结果,或者说训练的模型参数再进行一个网管中心集中式的决策,我们目前是希望借鉴联邦学习的方法,同时这个方法也可以保证网络里面信息安全的问题。


这是我们搭建的一个具体能够实现网络资源管控功能的SDN的系统,这是我们针对综合网管系统,这是给某一个部队做了资源联合管控的软件系统。



最后是流量预测与评估的研究,这个研究我稍微说一下,我们希望通过流量的预测与性能评估,反向反馈优化网络资源分配。我们通过图卷积的形式,将动态拓扑转为静态切片,通过SLTM工具提供网络中时间序列和业务序列,通过特征融合进行网络中不同元素的分析,通过这种方式可以对网络评得快,也可以让网络评估比较准确。


结果显示,我们网络性能评估的时效性和准确性相当于经典的方法,也是有了显著的提升。


04

总结



接下来说一下展望,这是我刚才介绍的网络管控中看控屏的三个关键的问题,也是三个关键的环节,我们做了一些试探性的出台性的工作。未来智能化的网络管控,我们在通信领域是达成共识,这种通信计算存储资源的联合优化,现在也叫3C融合的研究,也是目前对于资源管控里面重要的方向,涉及到关键技术也是在不断地更新,也是学习算法、人工智能的技术引进,可以对网络中的网络层、传输层、物理层进行一些不断的优化。


像频谱管理的,频谱管理在网络里面非常饱和了,以前传统的方法非常粗鲁,以前小灵通做的挺好,但是3G上来就把它取消了。5G提出了传统的700兆是用于电视广播的有很好的覆盖,传输距离非常远,但是5G需求很大,所以700兆的也是希望把频谱直接转让给5G,传统的电视广播不能再用这个频谱了。这种方式对于以前的技术,或者是以前的设备更新换代就会被淘汰掉了。频谱的智能化,我不于是取消以前的设备、技术进行一个智能化的调度、共享、协作,来实现网络的升级换代。

组织机构

主管单位
中华人民共和国科学技术部
国家科学技术奖励工作办公室
主办单位
中国人工智能学会

奖励资质