热门看点:刘韵洁院士:算力和网络还是“两张皮”

2022-10-19 20:32:11    来源:中国科学报    

中国算力的发展遇上“东数西算”战略,大家都在谈论算力网。但当前,算力与网络并未融合,二者不融合就无法提供“算力网络服务”。我认为,只有“确定性网络”才能保障算力网的健康发展。而“确定性网络”的建设,其实也正是算力网面临的挑战。


(相关资料图)

建设确定性网络的挑战,可简要提炼如下。

算力网络的“确定性”挑战

首先,是实时性的挑战,目前互联网几乎没有实时性的能力,而实时性能力,不论是工业控制、能源,还是电力,都对网络实时性提出了确定性指标,如时延的指标、抖动指标。如果这些领域不解决网络确定性问题,算力网是根本没法实现的。

第二是带宽的挑战,FAST每天产生的数据大概有2000多TB,散裂中子源每天产生的数据有600多TB,这么大量的数据,每天要与全球网络共享,网络的带宽不确定直接导致传输效率低下。

第三是算力成网的挑战,现在的算力网是“烟囱化”的算力,相互独立、缺乏感知、缺乏调度,算力利用率低,这使得大家使用算力的成本增加。

将来的算力应该都是易用的,就像水电一样即取即用,这也是算力网的愿景。但从以上几点来看,算力和网络还是“两张皮”。 这背后需要大带宽、低时延、低抖动、高可靠的“确定性网络”为支撑,需要确定性的算力网做基础。

如何解决这个问题,使算力跟网络深度融合,无疑是一个非常大的挑战。

这已不是人们第一次面对确定性网络的命题。早在2015年,国际互联网工程任务组(IETF)成立了一个工作小组,专门研究广域网的确定性标准,但至今没有标准化。国内也有包括电力、工业互联网等行业,也曾发布了有关确定性网络的白皮书。

但为何现在还没有解决这个问题?因为很难:要满足人们对算力网络大带宽、低时延、零丢包等的需求,就好比在一条普通的马路上,突然要开出一段高速公路甚至高铁。

我们目前使用的互联网就好比一条“普通马路”,堵堵停停,时延抖动难以控制。而确定性网络则是利用新技术构建“信息高铁”,是完全畅通的一条路,时延抖动是可定制的,可按用户需要提供服务,如此方能有效解决工业制造、能源、元宇宙等应用的精准控制问题。

确定性网络的实践探索

我认为,确定性网络是我国数字经济最重要的基础之一,远程医疗、新能源、交通系统、交易系统等应用场景,如果没有确定性网络做支撑,其既定的产业愿景就都难以很好地实现。

为了解决这些问题,我们(未来网络团队)不断探索,并取得了一些成果。

首先,针对当前互联网从“消费型”向“生产型”的转变需求,我们提出了服务定制网络 (Service Customized Network,SCN)技术体系,来解决网络架构问题。SCN包括“新型网络承载”“网络操作系统”与“云网超融合”三大平面,具有支撑产业互联网发展所亟需的智能、安全、柔性、可定制等特性。

第二,我们发展了用确定性网络的操作系统来进行全网调度。未来网络承担了国家大科学装置——未来网络实验设施(CENI)的建设工作。CENI 是我国通信与信息领域首个大科学工程。该设施2019年启动建设,建设周期5年,将建成一个开放、易使用、可持续发展的大规模通用试验设施,为研究新型网络体系架构提供简单、高效、低成本的试验验证环境,支撑我国网络科学与网络空间技术研究在关键设备、网络操作系统、路由控制技术、网络虚拟化技术、安全可信机制、创新业务系统等方面取得突破。

基于全新的网络架构,未来网络试验设施(CENI)已具备按需定制服务能力、确定性服务能力、多云互联服务能力、智驱安全防护能力四大关键能力,能够为企业提供低时延、低抖动、高可靠网络接入服务,更好地满足产业互联网对网络性能的苛刻要求。

目前,依托未来网络确定性网络技术,山东已建成并运行覆盖16地市、5600公里的全球首张确定性网络,经中国信息通信研究院测试,该确定性网络核心节点时延抖动控制在20 微秒以内,主要性能指标达到国际领先水平;今年6月30日前,升级完成了确定性网络2.0版。升级后,山东省16个地市,任何两个地市端到端的时延抖动都小于20微秒,而且能做到在高负载的情况下(负载92%)零丢包。目前我们做了12个小时,当然这个时间还不够长。

此外,在南京到贵阳的传输距离上,我们用确定性网络与非确定性网络做了对比实验,反复证明确定性网络与非确定性网络的传输差距明显。

在从南京到贵阳跨2450公里的100G试验网络中,由于传统网络存在大量的丢包与拥塞,在网络拥塞情况下,带宽利用率不足10%,难以满足算力数据中心跨广域的无损数据传输需求;而采用新型确定性无损传输技术后,可系统性解决网络带宽、时延、丢包问题,为业务提供有确定性保障的服务质量,峰值传输速率可提升至88%,可达到数据中心内部无损网络传输水平。

另外,我们还构建了确定性云网的算力网操作系统,即算网的操作系统,解决了算力资源和网络资源统一调度问题。在烟台和潍坊部分能源企业实验结果表明,算力速度比传统方式大概提高了75%。该综合能源系统可根据每一个企业的实时数据,经过算力系统的算法,提出科学的解决方案,降低能源用户成本,提高能源服务的质量和安全,最终达到降碳的目标。

确定性算力网络刚刚开始

基于确定性网络,我们也开展一些业务应用示范。

在远程医疗场景,确定性网络让手术操作跨越时空。今年2月,青岛大学附属医院副院长牛海涛团队,在济南操控一台机器人,“隔空”给青大附院市南院区动物实验室的试验动物猪进行了远程机器人辅助腹腔镜下肾脏切除术,用时20多分钟。整个过程网络时延不到6毫秒,创造了新的纪录。医院团队的远程手术应用的正是确定性网络。

目前通过确定性网络进行的远程手术已经有了几十例。在远程手术应用场景中,高清镜头下,医生可以通过远程操作机器人完成手术,患者远在几百公里之外。在确定性网络的保障下,远程手术中的时延、抖动都控制到了肉眼无法察觉的程度,医生操作稳定无卡顿,大大提高了手术成功率,让有需要的患者能够享受到千里之外专家级别的治疗。

在济南,我们针对智慧交通系统,通过确定性算力网络采集摄像头数据,得到了一份优化的调度方案,提高了16%的交通流量。这个应用,我们计划继续做下去。

另外,在和浪潮集团的合作中,利用浪潮的算力,建立矿山远程操作系统,使用确定性网络后,可实现整座矿山的无人驾驶,一个人就可以远程操作多辆矿车,减少了人力成本,提高了工作效率。

此外,确定性网络+算力,在数字孪生、元宇宙等方面也大有可为。

在中国,确定性算力网络还只是个开始,我们相信在算力网络建设方面,中国大有可为。未来,我们希望在标准体系、产业生态、原始创新等方面,与大家共同努力,开展更深入广泛的合作,让确定性算力网络从技术创新走向生产生活的方方面面。

(作者系中国工程院院士,本报记者赵广立受权根据其在2022中国算力大会上的发言及补充材料综合整理)

[责任编辑:h001]
关键词: 操作系统

相关新闻

联系邮箱:99 25 83 5@qq.com

备案号:豫ICP备2020035338号-4 营业执照公示信息

产经时报 版权所有