多元算力能力升级 青云科技AI智算平台驾驭算力融合与调度

“我们认为,未来将是AI的时代,而云计算将打破大规模通用算力、超算、智算的边界,延伸算力从中心到边端的分布,赋予算力新的价值。”青云科技(qingcloud.com) CEO 林源表示,“在未来,青云科技将基于十余年在云计算领域不断深耕的实践经验,与不同领域的合作伙伴一起,形成合力,更好地帮助企业驾驭AI。”

现阶段,算力主要可分为基础算力、智能算力和高性能计算算力3种类型。其中,基础算力主要基于CPU芯片,智能算力主要基于GPU芯片,而高性能计算算力主要基于CPU芯片和GPU芯片的融合。随着云计算的不断发展,AI、5G、物联网技术逐渐成熟,智慧政务、智慧能源、智慧金融、生物医药、工业仿真、无人驾驶、航空遥感等应用场景对高性能计算的需求不断增长,算力智能化升级成为趋势。

与此同时,我国在算力技术创新、应用赋能、标准建设、混合算力协同调度等方面面临诸多挑战,数据中心建设也面临多元算力难以统一管理、应用无法跨平台利用、存储难以高效共享、一体化数据中心运维管理难度大等业务难点。

青云科技紧抓数字化转型、信创产业发展及AI技术变革三大机遇,基于云计算技术发展与客户需求,不断升级算力设施相关能力,推出了青云 AI智算平台、青云 AI 算力云服务,以多元算力支持企业数字化革新。

青云AI智算平台集异构基础设施管理、数据存储运维、高性能分布式网络等能力于一体,具备自主创新、功能完善、智能运维、成熟运营、开源开放、安全合规、中立可靠、灵活部署八大优势,以及灵活调度、高速并行存储、分布式调度与管理、多区多业务资源整合、算法开发支持、混合组网、容器推理服务平台、模型仓库(MaaS)、AI训练平台九大关键能力,能够统一纳管多种异构服务器、存储、安全等设备,对通用云计算平台、容器平台、高性能计算平台、AI平台等算力平台的多元算力进行统一调度管理,实现了算力的统一调度、统一管理、统一运营,能够支撑各类产业应用开发与运营。目前,青云AI算力调度平台已成功在国家超算济南中心落地实践,助力其打造了山河云服务模式。

在资源调度能力方面,青云AI智算平台做了六方面的优化:一是通过统一镜像模式,实现了立即调度扩容数万卡资源;二是通过算法实现了通信链路的最短化,减少了数据的传输损耗;三是最大化系统利用率;四是将Kubernetes的调度优势充分发挥,实现了预留、暂停/恢复、公平共享和关键作业的抢占式调度;五是支持异构平台;六是凭借动态灵活的资源调度,能够优先解决AI系统中最具挑战性的事项。

在高速并行存储能力方面,青云AI智算平台通过青云存储U10000的对象存储能力构建了统一的数据存储底座,制定了数据生命周期分层策略,降低了存储成本;通过并行文件存储EPFS,能够满足成百上千个节点的同时访问需求;通过文件存储NAS,在推理场景下,提供多机DPU计算所需的标准文件接口。

在混合组网能力方面,青云AI智算平台支持跨区域高速网络互联,支持不同类型资源池互联,支持独立计算和存储IB网,支持专属访问存储高速网络,支持业务网络互联下发任务,保证了数据的安全隔离。

 

【本文结束】如需转载请务必注明出处:快科技

责任编辑:



来源:春哥技术博客,欢迎分享,转载请注明出处。(欢迎加春哥团队客服微信号:taike668)

本文地址:https://www.cgtblog.com/yj/10303.html
上一篇:比亚迪7.98万干翻燃油车!乘联会:2024年      下一篇:火山引擎veStack智算版 构建智能时代