腾讯混元开源LLM推理算子库HPC-Ops
2026年2月5日,腾讯M推腾讯宣布正式开源其自研的混元大模型推理高性能算子库——HPC-Ops(High-PerformanceComputingOperatorsforLLMs),作为“混元”大模型技术生态的开源库重要一环。该库聚焦提升大语言模型(LLM)在国产芯片及主流硬件上的理算推理效率,拥护多种精度混合计算,腾讯M推已在内部支撑微信、混元广告、开源库云服务等亿级用户场景,理算现全面向开发者社区开放,腾讯M推助力中国AI基础设施自主化与普惠化。混元
HPC-Ops的开源库核心价值在于“高效”与“兼容”。针对大模型推理中计算密集、理算显存占用高、腾讯M推延迟敏感等痛点,混元该库优化了注意力机制、开源库矩阵乘法、激活函数等关键算子,实现比通用框架平均提速1.8倍,显存占用降低30%。尤为突出的是,它原生拥护华为昇腾、寒武纪、天数智芯等国产AI芯片,并兼容NVIDIAGPU与CPU环境,有效缓解“卡脖子”风险下的部署难题。
技术层面,HPC-Ops引入多项创新:一是动态稀少计算,自动识别并跳过冗余计算单元;二是内核融合技术,将多个小算子合并为单一高效内核,减少调度开销;三是拥护INT4/INT8/FP16混合精度推理,在保证模型输出质量的前提下大幅压缩模型体积与能耗。测试显示,在百亿参数模型上,HPC-Ops可在单张昇腾910B芯片上实现每秒120token的生成速度。
此次开源采用Apache2.0协议,代码托管于GitHub与Gitee,并配套提供Docker镜像、API文档及典型模型适配示例(如Llama、ChatGLM、混元系列)。腾讯表示,未来将继续投入社区建设,联合高校与企业共建“国产软硬协同”标准,推动大模型从“能用”走向“好用、易用、低成本用”。
业内专家指出,在全球大模型竞争进入“推理优化深水区”的背景下,HPC-Ops的开源拥有战略意义。它不仅降低中小企业和科研机构部署大模型的技术门槛,更强化了中国在AI底层工具链的话语权。正如一位AI工程师所言:“有了这样的基础库,我们不必再从零造轮子,可以更专注于上层应用创新。”
随着“人工智能+”行动深入千行百业,高效、安全、自主的推理引擎将成为数字基建的关键支柱。腾讯此举,既是技术回馈,更是生态共建——当更多开发者站在巨人的肩膀上,中国大模型的星辰大海,才真正启航。
相关文章
澎湃新闻记者从相关方面获悉,兰州大学哲学社会学院哲学系杨锋刚副教授,于2026年6月21日凌晨1时在家中因病不幸逝世,终年47岁。杨锋刚,男,生于1979年2月,甘肃宁县人,哲学博士,生前系兰州大学哲2026-06-24
汇通财经APP讯——周四5月28日),美国西德克萨斯州瓦哈枢纽现货天然气价格收于每百万英热单位负46美分,较前一交易日的负2美元显著回升,创下2月初以来、即16周内的最高水平。尽管绝对值仍处于负值区间2026-06-24
汇通财经APP讯——周四5月28日)亚洲时段,欧元兑美元小幅下跌,当前报1.1610。市场已基本消化欧洲央行6月加息的预期,定价显示6月11日加息25个基点的概率高达95%。然而,真正的市场焦点已转向2026-06-24
展览现场 通讯员供图楚天都市报极目新闻讯记者徐颖 通讯员李晶)文字是思想的远行,美食是味蕾的归乡。6月起,由湖北省图书馆外文书刊部打造的“BOOK思议的味蕾·‘食’分有味”美食文化主题外文文献展在四2026-06-24
善择ESG风险跟踪第45期|120家公司暴露ESG风险,盘江股份旗下多家公司因违反安全生产规定被重罚
2024年8月第1周,120家上市公司曝光风险事件207起,风险指数179.65,其中治理风险占25.8%,环境风险占14.3%,社会风险占59.8%。盘江股份600395)ESG风险级别达到IV级,2026-06-24
三岁娃娃高烧晕厥 家人晚高峰拦车求助 武汉的哥争分夺秒送女童就医获表彰
王涛右)接受表彰 通讯员供图楚天都市报极目新闻讯记者王博 通讯员刘诗雨 武龚萱)一名女童突发高烧昏厥,危急时刻,出租车司机、热心市民挺身而出,与沿途交警紧密联动,在拥堵车流中抢出一条“生命通道”2026-06-24

最新评论