AI+算力技术

云计算时代有云原生的概念,在人工智能时代,尤其是大模型的涌现能力出现了之后,将来一定有“算力原生”,或者说叫“AI原生”的概念和技术体系。

“+AI”或者说AI赋能的概念是在一个传统的系统中的一部分功能使用一些AI的能力,比如说在一些设备的人机交互界面增加语音交互的能力,比如通过人脸识别进行身份验证,这些都是很典型也很普遍的+AI的应用场景。在这些场景中,很多时候之前的小模型已经取得了不错的效果,不需要大模型。

未来的AI原生应用将基于AI技术和算力,以知识的生产和输出作为目标,重构业务流程和系统架构,以更高效的利用算力产生价值。

面向 AI 的算力加速与优化技术

我们的云平台还内置了计算加速引擎,可以在英伟达、华为及其他国产AI芯片上实现计算加速。

平台内置的计算加速引擎,相比于知名开源项目 ComfyUI,可大幅提示推理速度。 无需引入不引入模型量化、裁剪、蒸馏等改变模型表现的操作就能够为用户一并解决系统运行不稳定或显存不足导致的系统崩溃问题。

智能运维技术

基于平台的故障监测、运行指标收集能力,结合故障应急处理专家系统的专家经验库和故障处置知识库,利用大模型的语言处理和推理分析能力,给出故障诊断结论,进行故障处置,并进行故障预测。

关于智能计算服务水平

全服务模式的支持:算力服务的使用模式,对于有完整技术体系的用户来说,他们往往更倾向于以 IaaS 的模式使用算力,对于不想做底层运维但有一定技术能力的用户来说 PaaS 模式可能是最合适的,对于做轻量化模型应用的用户来说,MaaS 模式是最合适的,而对于终端用户来说,以 SaaS 形式在具体场景有 AI 赋能的智能应用才能真正落地。算力服务平台需要能够支持不同的算力使用模式。

对能源效率的优化:智算中心需要消耗大量的电力,数据中心整体的 PUE 需要尽量低,使用的绿电占比得尽量高,才能降低智算中心算力运营的成本,所以能源效率也间接影响到用户使用算力服务的价格。