腾讯混元开源LLM推理算子库HPC-Ops

  发布时间:2026-03-05 16:44:27   作者:玩站小弟   我要评论
2026年2月5日,腾讯宣布正式开源其自研的大模型推理高性能算子库——HPC-OpsHigh-PerformanceComputingOperatorsforLLMs),作为“混元”大模型技术生态的重 。

2026年2月5日,腾讯M推腾讯宣布正式开源其自研的混元大模型推理高性能算子库——HPC-Ops(High-PerformanceComputingOperatorsforLLMs),作为“混元”大模型技术生态的开源库重要一环。该库聚焦提升大语言模型(LLM)在国产芯片及主流硬件上的理算推理效率,拥护多种精度混合计算,腾讯M推已在内部支撑微信、混元广告、开源库云服务等亿级用户场景,理算现全面向开发者社区开放,腾讯M推助力中国AI基础设施自主化与普惠化。混元

HPC-Ops的开源库核心价值在于“高效”与“兼容”。针对大模型推理中计算密集、理算显存占用高、腾讯M推延迟敏感等痛点,混元该库优化了注意力机制、开源库矩阵乘法、激活函数等关键算子,实现比通用框架平均提速1.8倍,显存占用降低30%。尤为突出的是,它原生拥护华为昇腾、寒武纪、天数智芯等国产AI芯片,并兼容NVIDIAGPU与CPU环境,有效缓解“卡脖子”风险下的部署难题。

技术层面,HPC-Ops引入多项创新:一是动态稀少计算,自动识别并跳过冗余计算单元;二是内核融合技术,将多个小算子合并为单一高效内核,减少调度开销;三是拥护INT4/INT8/FP16混合精度推理,在保证模型输出质量的前提下大幅压缩模型体积与能耗。测试显示,在百亿参数模型上,HPC-Ops可在单张昇腾910B芯片上实现每秒120token的生成速度。

此次开源采用Apache2.0协议,代码托管于GitHub与Gitee,并配套提供Docker镜像、API文档及典型模型适配示例(如Llama、ChatGLM、混元系列)。腾讯表示,未来将继续投入社区建设,联合高校与企业共建“国产软硬协同”标准,推动大模型从“能用”走向“好用、易用、低成本用”。

业内专家指出,在全球大模型竞争进入“推理优化深水区”的背景下,HPC-Ops的开源拥有战略意义。它不仅降低中小企业和科研机构部署大模型的技术门槛,更强化了中国在AI底层工具链的话语权。正如一位AI工程师所言:“有了这样的基础库,我们不必再从零造轮子,可以更专注于上层应用创新。”

随着“人工智能+”行动深入千行百业,高效、安全、自主的推理引擎将成为数字基建的关键支柱。腾讯此举,既是技术回馈,更是生态共建——当更多开发者站在巨人的肩膀上,中国大模型的星辰大海,才真正启航。

  • Tag:

相关文章

  • 助浴快车来了老年人家庭洗澡更方便

    对许多高龄、失能或行动不便的老人来说,“洗个热水澡”竟成了奢侈又危险的事。浴室湿滑、起身困难、体力不支……不仅影响个人卫生,更易引发皮肤感染、情绪低落甚至跌倒风险。如今,一种名为“助浴快车”的新型养老
    2026-03-05
  • TMGM黄金交易实战指南

    在全球金融市场中,黄金XAU/USD)始终是投资者避险和资产配置的首选。作为高流动性、24小时交易的热门品种,XAUUSD吸引了大量短线交易者与长期投资者。如果你正在使用或考虑使用TMGM平台交易黄金
    2026-03-05
  • 小区物业强制收停车费,业主集体维权

    近日,多地多个住宅小区接连曝出物业公司在未征得业主同意的情况下,单方面强制收取高额停车费,甚至以“不缴费就禁止车辆进出”相要挟,引发业主强烈不满。在江苏南京、广东深圳、四川成都等地,业主们纷纷组建维权
    2026-03-05
  • 洗洁精+洁厕灵清洁效果大减攻略

    “洗洁精家里常备,倒点进马桶也能去污吧?”“洁厕灵效果不够强,加点洗洁精会不会更好?”——这些看似“灵活变通”的做法,实则既**降低清洁效率,又潜藏安全风险**。洗洁精和洁厕灵,用途不同、成分相斥,绝
    2026-03-05
  • 好想来短秤,甩锅新员工引众怒

    近日,知名零食连锁品牌“好想来”被曝多地门店存在“短斤缺两”问题。有消费者在社交平台发布视频称,其在某门店购买标注重量500克的散装坚果,实际称重仅430克,误差高达14%。更令人不满的是,涉事门店负
    2026-03-05
  • 国家卫健委发布春节健康提示,警惕流感

    2026年春节临近,人员流动和聚集性活动显著增加,流感等呼吸道传染病传播风险上升。2月5日,国家卫生健康委员会发布《2026年春节假期健康提示》,呼吁公众提高防护意识,科学应对流感高发期,确保度过一个
    2026-03-05

最新评论