



时间:2025-05-19 关注公众号 来源:网络
在科技的璀璨星河中,阿里云揭开了一场智慧革命的序幕,推出震撼业界的Qwen3系列——混合推理模型的璀璨新星。这不仅仅是技术的跃进,更是思维与智能的融合,它以“快思考”的敏锐与“慢思考”的深邃,编织成一台超凡的思维机器,跨越语言的疆界,挑战智能的极限。
在这一壮丽变革的浪潮中,摩尔线程,如同一位技艺高超的航海家,以其自主研发的MUSA架构全功能GPU,成为首批驾驭这股力量的勇者。他们的合作,宛如天才的交响乐,不仅在兼容性的海洋中畅游无阻,更在效率的天空中翱翔,展现了前所未有的技术兼容性和创新速度。
Qwen3-235B-A22B与Qwen3-32B,这些听起来就像是未来世界的密语,它们在基准测试中击败强敌,如同智慧界的冠军,展现超凡实力。而“夸娥工场”,这个神秘的数字殿堂,成为了普通人触碰未来的入口,邀请每一位探索者体验这场由数据编织的梦境,感受Qwen3带来的不可思议。
在这片由算法构建的天地里,每一次推理都是一次心灵的对话,每一个解答都是智慧火花的碰撞。摩尔线程与Qwen3的结合,不仅是一次技术的胜利,更是人类向未知世界勇敢迈进的一大步,邀您一同启航,探索智能新时代的无限可能。
4月29日,阿里云正式推出了qwen3系列的8款开源混合推理模型。摩尔线程团队在发布当天便率先完成了对qwen3全系列模型在全功能gpu上的高效支持。这一成就充分展示了musa架构以及全功能gpu在生态兼容性和快速支持能力上的卓越表现。musa架构因其出色的易用性,不仅大大减少了开发者在适配和迁移过程中的工作量,还显著提升了开发效率,为创新成果的快速落地提供了坚实的支持。
Qwen3作为国内首个“混合推理模型”,创新性地将“快思考”和“慢思考”整合进了同一模型,在推理、指令遵循、智能体功能和多语言支持方面取得了突破性的进展。此次开源的两款MoE模型分别是Qwen3-235B-A22B和Qwen3-30B-A3B;同时还包括六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
根据官方发布的benchmark测试结果,Qwen3-235B-A22B在代码、数学、通用能力等基准测试中的表现显著优于OpenAI-o1和Deepseek-R1版本。Qwen3-32B在各项测试中的成绩同样优于OpenAI-o3-mini。
快速支持开放体验Qwen3创新成果
摩尔线程现已在“夸娥工场”开放上线了对Qwen3系列模型的支持成果。“夸娥工场”是摩尔线程精心打造的模型展示与体验中心,旨在为用户提供基于夸娥(KUAE)智算集群支持的模型能力体验。用户可以通过访问夸娥工场,亲自体验Qwen3强大的推理模型性能和创新技术。
▼夸娥工场”体验地址:
▼Qwen3体验地址:
目前,主流推理引擎均可基于摩尔线程MUSA平台运行Qwen3系列模型。MUSA平台凭借其卓越性能,能够作为vLLM、Ollama、GPUStack等各类主流开源推理引擎的后端,为Qwen3系列模型的高效运行提供强大动力。
例如,QWen3-235B-A22B(Qwen3系列最大参数量模型),基于vLLM-MUSA引擎在摩尔线程全功能GPU上稳定运行。
图示:QWen3-235B-A22B模型在vLLM-MUSA引擎适配
同时,GPUStack引擎与llama.cpp/ollama引擎也在摩尔线程图形显卡MTTS80上高效运行,充分展示了MUSA平台的广泛兼容性与卓越性能。
图示:GPUStack引擎在MTTS80上运行
图示:llama.cpp/ollama引擎在MTTS80上运行
共建开源生态持续推动国产GPU发展
摩尔线程积极响应开源社区的号召,旨在赋能更多开发者基于国产全功能GPU进行AI应用创新。在通义千问QwQ-32B发布当天,摩尔线程就成功实现了Day-0支持,这一成果充分验证了先进MUSA架构和全功能GPU的技术成熟度与可靠性。
我们诚挚欢迎广大开发者与用户前往“夸娥工场”进行体验,与此同时,开发者也可访问摩尔线程GitHub社区与开发者社区了解更多:
▼摩尔线程GitHub开源社区:
▼摩尔线程开发者社区:
摩尔线程始终致力于推动开源生态的发展,通过技术开放与生态共建,加速国产全功能GPU在AI计算领域的规模化应用,为更多用户提供更智能、高效的解决方案。
以上就是摩尔线程GPU率先支持Qwen3全系列模型的详细内容,更多请关注其它相关文章!
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系我们删除。(本站为非盈利性质网站)
电话:13918309914
QQ:1967830372
邮箱:rjfawu@163.com