“超算服务商业化”引领超算应用新趋势

2021-11-19 07:38:33    来源:中国科学报 发布时间:2021/11/19 7:11:19
    

近日,第三届中国超级算力大会(ChinaSC)在京召开。会上,中国计算机学会高性能计算专业委员会(CCF高专委)联合中国工业与应用数学学会高性能计算与数学软件专业委员会、中国智能计算产业联盟发布了中国高性能计算机(HPC)性能TOP100榜单。

中国HPC TOP100榜单的新特点

相比去年,本届榜单前10名有8个新面孔。其中,由某服务器供应商研制、部署于某网络公司的主机系统*以125PFlops(12.5亿亿次每秒)的测试性能登上榜首,打破了“神威·太湖之光”超级计算机对榜首长达5年的垄断,后者屈居榜眼。

另外,中国HPC TOP100排行榜来到第20个年头,出现了一个新特点:多个提供“商业化超算服务”的系统榜上有名。

比如北京超级云计算中心T6分区、A6分区、A分区登上榜单第7、10、11位,浙江云谷超级云计算中心M6分区、宁夏超算云E分区分列榜单第52、69位。其中,北京超级云计算中心一举在榜单斩获3席,这也是北京超级云计算中心(一期)继去年首次登榜之后再获殊荣。

这一局面的出现,正是我国超算服务商业化于近年来取得成功的一大力证。

北京超级云计算中心(又称“北京超算”)是其中最有代表性的。该中心成立于2011年11月,坐落于北京怀柔科学城。它由中国科学院与北京市政府共建,依托中科院计算机网络信息中心建设,具体由北京超级云计算有限公司运营。

北京超级云计算中心CTO郭宇向《中国科学报》介绍说,最初的几年,中心的运营模式与前述国家级超算中心相似。直到2017年,他们进一步加强商业化运行改革,引入专业的超算商业化运营公司“并行科技”开展深度合作。2018年开始,北京超级云计算中心实现盈利,宣告其商业化转型成功。

而北京超级云计算中心商业化转型成功的秘密,就隐藏在它的名字里——“云”。

2018年,北京超级云计算中心发布“中国科技云·超算云”。郭宇说,这种以云服务的理念和方式输出的超算资源,注重匹配需方的“按需供应”“随需扩容”的要求。该模式一经推出,即获得了中小型超算用户的欢迎。

3年来,北京超算不断创新和发展这一理念,用户数量也稳定增长。并行科技提供的最新数字显示,目前北京超算服务的中小企业用户数已达到16万,年交易量突破10亿元。

相应地,用户数量的增长也推动着北京超算算力规模的扩张。目前,北京超算拥有惊人的近50PFlops的通用CPU算力,纯CPU性能位列全国第一,已成为国内最大的通用超算集群。郭宇还披露,在北京市、怀柔区两级政府的支持下,北京超算(二期)即将在怀柔科学城盛大启幕,“未来将在首都科技创新、京津冀协同发展中再立新功”。

“超算商业化”之路

作为超算大国,我国拥有多种不同规模的超算类型。从国家投资建设的国家级超算中心(尖端超算),到地方省市投建或高校运行的大型超算,再到科研机构、企业等建设的中小型超算,不一而足。

然而即便如此,并非所有有超算应用需求的单位团体或个人都有触手可及的算力资源;相反,由于大多数超算开放程度并不高,反而让超算的使用门槛在无形中变得更高。

一边是排不到超算资源可用,一边是潜在的超算利用率不高,这给“超算商业化”提供了成长的土壤。

然而,超算商业化这条路走来并不容易。“要将超算资源提供给各行各业,除了需要大量的技术投入、软件开发与适配、服务人员跟进之外,‘市场空间到底有多大’更加重要,因为这直接决定商业化超算到底能不能盈利。”郭宇说。

当然,郭宇也告诉记者,超算商业化得以成功的基础在于,有足够的技术投入帮助用户获取省心、便宜的超算。因为对于大部分超算用户来说,超算的速度和价格是最“刚需”的。运营者对外提供超算服务,只有同时满足这两点,用户才愿意买单。

迈不过“技术门槛+市场规模”,也是目前市场上超算商业化公司相对较少的原因之一。

但现在情形有些不同了。超算这只“旧时王谢堂前燕”,如今正待“飞入寻常百姓家”,已成大势所趋。不仅阿里云、华为云等云计算厂商开始介入这一赛道、同类型超算服务公司闻风而动,一些超算运营单位也在谋求超算商业化之道。

谈及北京超算的成功,郭宇认为既有外因,也有内因。

“行业大环境非常好、市场规模变大、云计算行业快速发展、用户需求快速增长是外因,北京超算聚焦以用户为中心的产品与服务价值体系是内因。”郭宇说:“现在北京超算可以提供用户更具性价比的算力——用户以相同IT支出预算,能够获得3倍计算算力。”

“‘发电机’在哪儿并不重要

除了提供性价比更高的超算资源,“让计算不排队”是当下北京超级云计算中心提供超算服务的另一个核心理念。

国家级超算中心作为尖端超算,虽然也是开放资源,但它们肩负着支撑国家重大科技研发项目的重要使命,因此在国家超算面前,重量级科研项目优先。许多中小用户向国家级超算平台提交的使用请求,往往都要“先排队”。

“排队计算”显然不是好的使用体验。

因此,北京超算“随需扩容,按需使用”的服务模式,成了这些超算应用“散户”们最好的归宿。郭宇介绍说,北京超算为用户提供独占、包核时等使用方式,同时提供数量和类型丰富的配置资源,这保障中小用户能够通过弹性扩展,有效支撑“高峰—平峰”使用需求。

此外,为了满足不同类型的超算应用需要,北京超算划分了数个分区,它们中有的内存更大、有的计算性能更高、有的数据传输速度更快,不一而足,此次上榜的3个分区就各有千秋。

不断动态扩容、动态升级以实现对需求变化的及时响应,也成为北京超算一种常态。用郭宇的话来说,北京超算或许是对“散户”最友好的超算平台了。

计算是一种能力,也是一种资源,它将是驱动整个社会发展的不可缺少的动力和资源。因此,如果超算平台采用“北京超算”模式,让它们以“超级云计算”模式为更多有超算应用需求的人提供物美价廉的超算服务,那么它们不管分布在哪里,都会成为推动社会进步的算力底座。

现在,这个名单上除了有北京超算,还有浙江云谷超级云计算中心、宁夏超算云……这个名单正待变得更长。有许多业内人士提出,希望未来地方政府不要视建成大型超算为政绩的衡量指标,而是以超算的有效利用为标尺来衡量——毕竟“用好”和“好用”才是超算存在的终极要义。

身在其中的人更有感受。

“我们的理想是不必人人都拥有超算,而是让人人都享受高性能计算的服务能力。”郭宇说,在底层的超算算力资源好比是发电站,用户们都能享受到服务就好,至于发电机在哪儿,没那么重要。

[责任编辑:h001]
关键词:

相关新闻

联系邮箱:99 25 83 5@qq.com

备案号:豫ICP备2020035338号-4 营业执照公示信息

产经时报 版权所有