当前位置:首页 > 谈天说地

拆解华为盘古大模型:与ChatGPT有何不同?

34资源网2023-04-10436

AI大模型热潮持续

编者按:本文来自微信公众号 时代周报(ID:timeweekly),作者:杨玲玲 郑栩彤,编辑:林铭铭,创业邦经授权发布,头图来源摄图网

AI大模型热潮持续,国内多家科技企业已走出不同路径:百度集团发布文心一言,成为中国第一个类ChatGPT产品;阿里巴巴的类ChatGPT产品通义千问,也在近日开启外部测试。

而市场传言,华为亦将加入大模型竞赛,发布“盘古系列AI大模型”,但时代周报记者未在华为云官网找到相关信息,咨询华为云相关人员“盘古系列AI大模型”上线时间也没有得到明确答复。

4月8日,华为云人工智能领域首席科学家田奇在人工智能大模型技术高峰论坛上发言。论坛上,田奇并未透露关于盘古大模型的最新变化和产品计划,亦未透露更多NLP大模型的消息,而该模型是被认为最接近人类中文理解能力的AI大模型。

但田奇表示,华为云盘古大模型推动人工智能开发从“作坊式”到“工业化”升级。目前,华为已陆续发布矿山、气象、海浪等系列盘古行业大模型,展望未来,AI for Industries是人工智能新的爆发点。

△图源:田奇演讲PPT

当大厂们相继涌入大模型赛道,各行各业纷纷接入大模型提供的AI能力,预示着一场声势浩大的技术革命悄然发生,新的产业风口正在形成。风口之下,华为盘古大模型与其他“类ChatGPT”产品究竟有何不同?

01 拆解盘古大模型

田奇的演讲内容并不新颖。在3月举办的博鳌亚洲论坛2023年年会上,田奇就称“AI for industries将成为人工智能新的爆发点”。

对于广受关注的盘古NLP大模型,田奇透露的细节不多,而这一大模型正是ChatGPT、文心一言、通义千问等近期走红的大模型所属的技术领域。

会上,田奇只简单介绍称,目前,在NLP大模型上,华为盘古聚焦文本生成与内容理解,已进入智能文档搜索、智能ERP、小语种大模型领域,落地企业财务异常检测、阿拉伯语大模型等场景。

市场对盘古新NLP模型的期待,来自于这一模型此前的突出表现。资料显示,2019年的权威中文语言理解测评基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项的排名均为第一,总排行榜得分83.046,接近85.61的人类水平。

上海证券分析师陈宇哲在研报中称,在早前的华为开发者大会上,华为曾宣布盘古大模型是业界首个千亿级生成与理解中文的NLP大模型,其认为未来有望成为国内最强的Chat GPT应用。

演讲的后半段,田奇重点介绍了盘古CV大模型和科学计算大模型,以及它们的应用场景。比如,CV领域的矿山大模型、基于盘古CV大模型的铁路巡检方案等,以及科学领域的盘古气象大模型、药物分子大模型、海浪预测大模型。

其中,盘古矿山大模型通过5G+AI全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业;华为云盘古气象大模型,可实现20公里范围内、小时级、13层最高精度气象预报,如台风生成时间与移动硅基的预测准确率达85%以上;华为云盘古药物分子大模型,让先导药的研发周期从数年缩短至1个月,同时降低70%的研发成本。

浙商证券分析师陈杭撰写研报表示,在ChatGPT背后,不断迭代的GPT系列使得大模型成为当下科技企业核心竞争力的重要体现,未来,大模型将成为AIGC时代的核心支撑。华为作为国内科技龙头,2021年发布的盘古大模型有望在AIGC时代中引领潮流。

02 大模型洗牌提速

加入华为之前,田奇已经是AI领域业界知名的学者。2020年3月,田奇加入华为云后便开始组建团队并进行方向梳理;9月,团队开始推动盘古大模型的立项,希望能够在华为云的产业基座上,完成适配各个产业AI开发的大模型;11月,盘古大模型在华为云内部立项成功,并完成与合作伙伴、高校的合作搭建。

据媒体报道,支撑盘古大模型不断攻坚克难的团队,起初仅有几个人,他们是让盘古大模型得以从实验室走向产业的中坚力量。随后,团队逐渐壮大起来,拥有20多名博士、30多名工程师、3名广受关注的“华为天才少年”,还有50多名来自全国C9高校的专家。

要打造一个属于中文世界,并且适配各种真实产业场景的AI预训练大模型,摆在研发团队面前的是两大门槛。

一个是技术门槛,大模型需要卓越的并行优化来确保工作效率,这对网络架构设计能力提出了更高的要求;第二是资源门槛,大模型训练需要极大的算力,在训练千亿参数的盘古大模型时,团队调用了超过2000块的昇腾910,进行了超过2个月的训练。

2021年4月,盘古大模型正式对外发布。盘古大模型发布以来,已经发展出L0、L1、L2三大阶段的成熟体系持续进化。

所谓L0,是指NLP大模型、CV大模型等五大水平领域的基础大模型;而L1指行业大模型,比如气象、矿山、电力等行;L2指面向各行业中细分场景的模型,比如电力行业的无人机巡检。

去年9月,华为轮值董事长胡厚崑在2022世界人工智能大会上表示,华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成“基础大模型-行业大模型-细分场景大模型”的发展路径,并且在医疗、互联网、金融、煤矿、农业、气象等领域中实现降本增效。

如今,随着华为、百度、阿里、腾讯等科技企业陆续推出相应产品,以及商汤科技、科大讯飞宣布发布计划,大模型赛道将进一步拥挤,市场普遍认为,未来大模型市场势必将迎来新一轮的整合与洗牌。

田奇也在分享中提到,未来“大模型将成为应对AI领域应用碎片化的一种方式,相较于此前不同场景对应不同小模型的状况,未来大模型有可能收编高度定制化的小模型,导致市场向大公司集中”。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

看完文章,还可以扫描下面的二维码下载快手极速版领4元红包

快手极速版二维码

快手极速版新人见面礼

除了扫码领红包之外,大家还可以在快手极速版做签到,看视频,做任务,参与抽奖,邀请好友赚钱)。

邀请两个好友奖最高196元,如下图所示:

快手极速版邀请好友奖励

扫描二维码推送至手机访问。

版权声明:本文由34楼发布,如需转载请注明出处。

本文链接:https://www.34l.com/post/32725.html

分享给朋友:

相关文章

互联网公司好日子到头,逻辑彻底变了

互联网公司好日子到头,逻辑彻底变了

好日子到头了,逻辑彻底变了,互联网公司已经不再是香饽饽。有两个重要的信号。…

令人受益的三种说话方式了解一下

令人受益的三种说话方式了解一下

有人说:人与人之间最累的关系就是感觉话不投机,说得越多越费劲,最后只能无话可说其实,想让别人喜欢听你说话,要先掌握正确的表达方式。你对别人说话的样子,决定了你在别人眼中的样子。…

抖音长视频怎么开通?抖音开通长视频的权限分享

抖音长视频怎么开通?抖音开通长视频的权限分享

经常玩抖音的朋友来说开通抖音1分钟长视频已经不是一件难事了。大家都知道抖音默认视频长度为15秒。只有达到一定要求才可以获得长视频权限。但是现在我们发现能发抖音长视频的朋友越来越多了。他们是怎么做到的呢?抖音怎么发长1分钟视频呢?抖音长视频是…

视频号怎么开通微信小商店技巧流程方法分享

视频号怎么开通微信小商店技巧流程方法分享

这两年直播的风口一直高居不下,微信终于也跟上了直播热潮,视频号直播新增购物车功能,已经开通了小商店的视频号,可以在直播中上架小商店商品,直播过程可以展示并售卖商品。视频号直播带货无疑让更多创作者加入其中,同时也意味着视频号功能的进一步完善,…