H800国内首发腾讯云发布最新高性能计算集群-速修电器「半小时极速上门」

H800国内首发腾讯云发布最新高性能计算集群

4月14日，腾讯云正式发布新一代HCC（High-Performance Computing Cluster）高性能计算集群。该集群采用腾讯云星星海自研服务器，搭载英伟达最新代次H800 GPU，服务器之间采用业界最高的3.2T超高互联带宽，为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。

实测显示，腾讯云新一代集群的算力性能较前代提升高达3倍，是国内性能最强的大模型计算集群。

2022年10月，腾讯完成首个万亿参数的AI大模型——混元NLP大模型训练。在同等数据集下，将训练时间由50天缩短到11天。如果基于新一代集群，训练时间将进一步缩短至4天。

大模型进入万亿参数时代，单体服务器算力有限，需要将大量服务器通过高性能网络相连，打造大规模算力集群。通过对处理器、网络架构和存储性能的全面优化，腾讯云攻克了大集群场景下的算力损耗问题，能为大模型训练提供高性能、高带宽、低延迟的智算能力支撑。

网络层面，计算节点间存在海量的数据交互需求，随着集群规模扩大，通信性能会直接影响训练效率。腾讯自研的星脉网络，为新一代集群带来了业界最高的3.2T的超高通信带宽。实测结果显示，搭载同样的GPU卡，3.2T星脉网络相较前代网络，能让集群整体算力提升20%，使得超大算力集群仍然能保持优秀的通信开销比和吞吐性能。并提供单集群高达十万卡级别的组网规模，支持更大规模的大模型训练及推理。

存储层面，几千台计算节点同时读取一批数据集，需要尽可能缩短加载时长。腾讯云自研的文件存储、对象存储架构，具备TB级吞吐能力和千万级IOPS，充分满足大模型训练的大数据量存储要求。

底层架构之上，针对大模型训练场景，新一代集群集成了腾讯云自研的TACO Train训练加速引擎，对网络协议、通信策略、AI框架、模型编译进行大量系统级优化，大幅节约训练调优和算力成本。

腾讯混元大模型背后的训练框架AngelPTM，也已通过腾讯云对外提供服务，帮助企业加速大模型落地。

目前，腾讯混元AI大模型，已经覆盖了自然语言处理、计算机视觉、多模态等基础模型和众多行业、领域模型。

在腾讯云上，企业基于TI平台的大模型能力和工具箱，可结合产业场景数据进行精调训练，提升生产效率，快速创建和部署AI 应用。

此前，腾讯多款自研芯片已经量产。其中，用于AI推理的紫霄芯片、用于视频转码的沧海芯片已在腾讯内部交付使用，性能指标和综合性价比显著优于业界。其中，紫霄采用自研存算架构，增加片上内存容量并使用更先进的内存技术，消除访存能力不足制约芯片性能的问题，同时内置集成腾讯自研加速模块，减少与CPU握手等待时间。目前，紫霄已经在腾讯头部业务规模部署，提供高达3倍的计算加速性能，和超过45%的整体成本节省。

目前，腾讯云的分布式云原生调度总规模超过1.5亿核，并提供16 EFLOPS（每秒1600亿亿次浮点运算）的智算算力。未来，新一代集群不仅能服务于大模型训练，还将在自动驾驶、科学计算、自然语言处理等场景中充分应用。

以新一代集群为标志，基于自研芯片、星星海自研服务器和分布式云操作系统遨驰，腾讯云正通过软硬一体的方式，打造面向AIGC的高性能智算网络，持续加速全社会云上创新。

(8158755)

标题：H800国内首发腾讯云发布最新高性能计算集群

地址：http://www.hmhjcl.com/gzdm/13152.html

H800国内首发腾讯云发布最新高性能计算集群

三菱中央空调24小时人工客服(三菱空调的常见故障三菱空调故障排查与解决：常

大金空调桐乡维修(如何找到可靠的维修服务商)

英媒：英国将于明天举行仪式，查尔斯三世将正式登基

空调电压不足显示什么原因是什么(如何解决电压不足问题)。

大金空调u2主板维修(应该如何操作)？

大金空调u4主板图解维修视频(如何轻松修复空调主板故障)

3胜6负，中国男篮世界杯热身赛含金量很足

空调开关hl代表什么(详解空调开关显示屏上的hl图标)。

「检修」约克空调维修中心解说什么是高效直流

马克龙涉华表态，获得多国力挺，美国态度也变了，布林肯再提访华

格力空调怎么不热？为什么格力空调制热效果不佳？

格力显示E5怎么处理？格力空调显示E5故障，如何快速有效解决？

宏霆机房空调24小时人工服务是多少？宏霆机房空调24小时人工服务费用如何计

永发保险柜售后维修是多少

英特尔18A工艺准备就绪，计划上半年开始流片

H800国内首发 腾讯云发布最新高性能计算集群

H800国内首发腾讯云发布最新高性能计算集群