腾讯混元开源LLM推理算子库HPC-Ops

  发布时间:2026-05-01 02:35:18   作者:玩站小弟   我要评论
2026年2月5日,腾讯宣布正式开源其自研的大模型推理高性能算子库——HPC-OpsHigh-PerformanceComputingOperatorsforLLMs),作为“混元”大模型技术生态的重 。

2026年2月5日,腾讯M推腾讯宣布正式开源其自研的混元大模型推理高性能算子库——HPC-Ops(High-PerformanceComputingOperatorsforLLMs),作为“混元”大模型技术生态的开源库重要一环。该库聚焦提升大语言模型(LLM)在国产芯片及主流硬件上的理算推理效率,拥护多种精度混合计算,腾讯M推已在内部支撑微信、混元广告、开源库云服务等亿级用户场景,理算现全面向开发者社区开放,腾讯M推助力中国AI基础设施自主化与普惠化。混元

HPC-Ops的开源库核心价值在于“高效”与“兼容”。针对大模型推理中计算密集、理算显存占用高、腾讯M推延迟敏感等痛点,混元该库优化了注意力机制、开源库矩阵乘法、激活函数等关键算子,实现比通用框架平均提速1.8倍,显存占用降低30%。尤为突出的是,它原生拥护华为昇腾、寒武纪、天数智芯等国产AI芯片,并兼容NVIDIAGPU与CPU环境,有效缓解“卡脖子”风险下的部署难题。

技术层面,HPC-Ops引入多项创新:一是动态稀少计算,自动识别并跳过冗余计算单元;二是内核融合技术,将多个小算子合并为单一高效内核,减少调度开销;三是拥护INT4/INT8/FP16混合精度推理,在保证模型输出质量的前提下大幅压缩模型体积与能耗。测试显示,在百亿参数模型上,HPC-Ops可在单张昇腾910B芯片上实现每秒120token的生成速度。

此次开源采用Apache2.0协议,代码托管于GitHub与Gitee,并配套提供Docker镜像、API文档及典型模型适配示例(如Llama、ChatGLM、混元系列)。腾讯表示,未来将继续投入社区建设,联合高校与企业共建“国产软硬协同”标准,推动大模型从“能用”走向“好用、易用、低成本用”。

业内专家指出,在全球大模型竞争进入“推理优化深水区”的背景下,HPC-Ops的开源拥有战略意义。它不仅降低中小企业和科研机构部署大模型的技术门槛,更强化了中国在AI底层工具链的话语权。正如一位AI工程师所言:“有了这样的基础库,我们不必再从零造轮子,可以更专注于上层应用创新。”

随着“人工智能+”行动深入千行百业,高效、安全、自主的推理引擎将成为数字基建的关键支柱。腾讯此举,既是技术回馈,更是生态共建——当更多开发者站在巨人的肩膀上,中国大模型的星辰大海,才真正启航。

  • Tag:

相关文章

  • 含氯消毒剂家庭使用方法安全消毒科普

    消毒液、漂白粉等含氯消毒剂因价格低廉、杀菌谱广,成为许多家庭的“消毒常备品”。然而,若使用不当,不仅达不到消毒效果,还可能引发皮肤灼伤、呼吸道刺激、物品腐蚀,甚至产生有毒气体如氯气)导致中毒。尤其在流
    2026-05-01
  • 移民执法引发多地抗议特朗普表态“退了一步”

    2026年初,一场由移民执法引发的社会风暴席卷美国。1月28日至29日,明尼阿波利斯市接连发生两起联邦执法人员枪击事件,造成包括重症监护室护士亚历克斯·普雷蒂在内的两名公民死亡。目击视频显示,受害者手
    2026-05-01
  • 读懂布林带收口开口:预判黄金行情涨跌方向

    在2026年震荡与趋势交替的黄金市场中,布林带BollingerBands)的“收口”与“开口”形态,是预判变盘时机的关键信号。它不预测方向,却能告诉你“风暴即将来临”——而聪明的交易者,总在风暴前做
    2026-05-01
  • 减重门诊科普从瘦下来到健康起来

    “我想减肥”是许多人挂在嘴边的话,但真正实现科学、持久、健康的减重却并不容易。节食反弹、运动受伤、盲目吃代餐……这些误区不仅无效,还可能损害健康。近年来,越来越多医院开设“减重门诊”,由多学科团队提供
    2026-05-01
  • 你家电视关机后拔电源吗家电使用常识

    按下遥控器“关机”键,电视屏幕熄灭,很多人便以为它已“休息”。但事实上,大多数电视仍处于**待机状态**——指示灯微亮,内部电路部分通电,随时准备响应开机指令。那么,关机后是否需要拔掉电源?这个问题看
    2026-05-01
  • 反向过年火了,长辈进城成新趋势

    随着春节临近,“反向过年”正悄然成为一种新风尚——不再只是年轻人返乡,越来越多父母、祖辈选择在节前乘坐高铁、飞机来到子女工作的城市团聚。据文旅和交通部门数据显示,2026年春运期间,60岁以上旅客跨城
    2026-05-01

最新评论