芯城品牌采购网 > 品牌资讯 > 行业资讯 > 摩尔线程开源 MusaCoder 全栈训练代码大模型
6 月 10 日,摩尔线程正式发布并开源MusaCoder,这是业内首个基于国产 GPU算力底座完成全链路训练与验证的专用代码大模型,聚焦 GPU 底层算子生成场景。
MusaCoder 包含9B与27B两个参数版本,核心能力是从 PyTorch 标准算子自动生成高性能CUDA/MUSA 原生 Kernel 代码,可大幅降低开发者手写底层 GPU 算子的技术门槛,提升高性能计算场景下代码生成、验证与优化的整体效率。
该模型的全栈训练与验证流程(含 SFT 监督微调、RFT 拒绝采样微调、RL 强化学习、异步 rollout、在线编译执行验证及 reward 计算),均在摩尔线程MTT S5000构建的夸娥智算集群上完成。这标志着国产 GPU 不仅能支撑大模型推理与常规微调,更可稳定承载代码大模型后训练全周期算力需求,尤其适配 GPU Kernel 生成这类需频繁编译、执行与反馈的高要求任务。
性能层面,在权威评测基准 KernelBench 中,MusaCoder-27B-RL表现亮眼,Overall Pass@8 达93.2%、Avg.@8 达88.60%,超越 Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6 等主流 SOTA 代码模型,跻身行业领先水平。
免责声明:
文章内容转自互联网,不代表本站赞同其观点;
如涉及内容、图片、版权等问题,请联系2644303206@qq.com我们将在第一时间删除内容!