每日头条!直接在浏览器上使用集群算力?SCOW:可以

2022-12-15 21:45:18    来源:中国科学报    


(资料图片)

12月15日,正在云端举行的2022 CCF全国高性能计算学术年会(CCF HPC China 2022)上,业界学者专家在线隔空对话,围绕高性能计算的场景化应用等话题,共论新一代信息技术未来的发展趋势。

北京大学计算与数字经济研究院算力网络研究中心主任樊春应邀参加本次大会第七届高校高性能计算平台应用交流论坛,并作《北京大学高性能计算系统软件》主题演讲。演讲中,他向大会介绍了其团队自主研制的开源算力中心门户和管理平台——SCOW(Super Computing On Web)。

这是SCOW平台首次公开亮相。樊春介绍说,该平台系统通过简化集群软件部署流程、统一平台管理模式、提供图形化操作界面来降低用户使用算力的门槛,致力于实现算力中心资源易管理、易使用的目标,提高算力资源使用效率。截至目前,SCOW已完成了在北京大学超算平台、国家天文台超算平台、中南大学超算平台、中科院高能物理所超算平台、香侬云超算平台等多个平台的部署。

樊春说,SCOW提供的一套标准的平台接口,为实现跨中心的算力融合打下了基础。其团队正在SCOW实现的异构平台统一抽象基础上,进行一体化算力网络融合平台的研制,旨在打通算力网络中各算力中心的管理、使用及结算通道,连通算力孤岛,实现算力灵活接入、统一调度。同时,该平台还致力于解决多应用灵活接入、复杂网络环境下低延迟高性能应用可视化技术、多中心多集群文件传输与管理、算力中心的标准化运营管理、多中心统一结算等问题。

在使用上,SCOW系统可大幅降低算力中心用户的使用门槛。用户无需了解和配置SSH、VNC等功能,便可通过SCOW的门户平台直接在浏览器上使用集群算力资源,让Linux“小白”也能顺利提交作业。

在管理上,SCOW的管理平台提供了一套标准化的算力中心管理模式以及用户账户模型(租户-账户-用户三级模型)和计费收费模型,并且支持多集群管理,可以在一个系统内管理算力中心的多个集群,能够帮助新建的算力中心快速建立管理和运营制度。

在部署上,SCOW提供了简易的部署功能,项目具备了包括调度系统、认证系统、共享存储在内的一体化部署能力,可以快速在新建的集群中部署上线。部署几乎无侵入,可与其他管理平台共存。

我国“东数西算”工程的全面启动,为全国一体化算力网络建设按下了加速键,但同时我国仍面临算力中心管理运营难、算力资源使用门槛高、算力系统运维部署复杂等痛点。樊春表示,接下来他们也将在国内高校、科研机构、国家超算、商业集群中做好SCOW的推广部署工作。

[责任编辑:h001]

相关新闻

联系邮箱:99 25 83 5@qq.com

备案号:豫ICP备2020035338号-4 营业执照公示信息

产经时报 版权所有