您当前所在位置: 主页 > 商会动态 > 对外交流

盘古Pro MoE大模型竟比肩DeepSeek-R1?你知道为什么吗

发布时间:2025-06-21 01:04|栏目: 对外交流 |浏览次数:

盘古大模型知乎__盘古大模型是干什么的

您瞧瞧,咱现在看到这么个厉害事!这个模型在智能体任务打榜成绩都能和那 6710 亿参数的 DeepSeek - R1 比肩在文本理解和创作领域更是成了开源模型里数一数二的,你说这能不吸引人注意

_盘古大模型是干什么的_盘古大模型知乎

适配硬件的最优架构

这个模型,可是大有来头。它是针对昇腾硬件特性做了好多仿真建模之后才搞出来的最优架构。特别是跟那 300I Duo 推理芯片的宽度、深度、专家数这些都适配得特别好。你想,就像一把钥匙刚好配一把锁一样,适配性这么好,那效果肯定差不了。在 5 月底华为就发布了盘古 Pro MoE 的技术报告,感兴趣的朋友到时候可以去看看详细情况。

通过这种适配计算机也能更好地发挥硬件的能力,就好像千里马遇到了好伯乐。咱这么说,合适的硬件搭配上对的算法架构,就为后面模型的好效果打下了坚实的基础。

算法提升吞吐效率

盘古大模型是干什么的__盘古大模型知乎

它用的算法那也是相当巧妙的。这个算法有啥本事?就是能实现跨芯片计算的负载均衡。咱们打个比方就好像一群人干活,要是合理分配任务,那每个人都不会太累,干活效率还老高了。这个算法就是这样,让跨芯片计算的时候把任务平均分摊,不会有的地方忙得要死,有的地方闲得没事干。

这么做带来的最直接好处就是,显著提升了盘古训推系统的吞吐效率。效率提升了,完成任务的速度就加快,不管干什么都方便不少。所以说这算法,真的是提升系统性能的一把利器

盘古大模型是干什么的_盘古大模型知乎_

长序列计算优化

盘古大模型是干什么的__盘古大模型知乎

在长序列计算这块儿,华为可是下了大功夫的。为了对长序列进行重点优化,华为提出了 Adaptive SWA 和 ESA 两项关键技术。传统的方法在计算长序列的时候可能又耗时间又容易出问题。但是这两个新技术,就好比给计算“瘦身”了,能大大降低在长序列的场景中的计算量和 KV Cache 。

这就意味着,在处理长文本、长数据的时候,模型能更加轻松高效,就好像给计算机减负一样。要知道在很多实际应用中,像分析大篇幅的论文、报告,长序列计算的优化可是相当重要的这使得盘古模型在这方面领先一步

解决幻觉问题方案

盘古大模型是干什么的__盘古大模型知乎

幻觉问题一直是大模型里让人头疼的事情。华为针对这个问题,提出了知识边界判定、结构化思考验证等创新方案。有些模型在推理的时候可能会生成一些似是而非、不切实际的内容,也就是所谓的“幻觉”,但是华为的方案能让它更加靠谱。

它们就像是给模型安上一个“紧箍咒”和“探测器”,让模型知道自己该说啥不该说啥,还能验证自己说得对不对。这样下来,模型推理准确度就大大提升,可靠性一下子就上来了,在实际应用中给用户的帮助也就更大了。

自适应快慢思考

目前业界处理问题难易程度的切换一直不太完美,很多方案只是通过 prompt 隔离来弄,却没办法真正自动感知问题的难和易。华为就专门去解决这个问题,提出了自适应快慢思考合一技术。

这么个技术是怎么实现的?就是构建难度感知的快慢思考数据,还提出两阶段渐进训练策略。打个比方,模型就好像有快慢两条车道,遇到简单问题它就从快车道直接快速回复,遇到复杂问题就到慢车道深度思考。整体推理效率最高可以提升高达 8 倍,是不是特别厉害!而且在慢思考模式 ,还提出来了反思投机和反思压缩等策略,在精度无损的情况下能把慢思考时间减少 50% ,这就让盘古大模型既准又快

盘古大模型知乎__盘古大模型是干什么的

盘古 DeepDiver 的本事

华为发布的盘古 DeepDiver,那可不能小瞧。它是个开放域信息获取 Agent ,就好比是一个小助手,能在网页搜索、常识性问答等应用里,让盘古 7B 大模型实现接近 DeepSeek - R1 这种超大模型的效果。据王云鹤介绍在研发制作 DeepDiver 的时候,还根据实际场景构建大量合成交互数据,并且通过渐进式奖励策略等优化方法,在开放环境进行强化学习训练了

你看,盘古 DeepDiver 厉害之处还不止这些。它的执行效率超高,5 分钟就能完成超过 10 跳的复杂问答,甚至能生成万字以上的专业调研报告。因为这个 DeepDiver ,盘古大模型的自主规划、探索、反思等高阶能力,也得到了前所未有的加强。

各位读者朋友,你们说这盘古模型这么多功能改进,未来还会在哪些行业有大作为?要是觉得文章不错,别忘了点赞分享!

盘古大模型知乎_盘古大模型是干什么的_

Copyright © 2002-2025 大连市同乐中小企业商会 版权所有 Powered by EyouCms
电话:15556325500 地址:大连市中山区独立街31号远达大厦B座1802室 备案号:辽ICP备16005699号-1
网站地图