欢迎来到玄虚秋华网

“不逊色 GPT sitemap

玄虚秋华网

当前位置：

“不逊色 GPT

时间:2024-11-01 23:32:01 出处:综合阅读（143）

就在适才，不逊文心大模子 4.0 版本正式宣告！不逊

北京首钢园现场，不逊李彦宏直接放话：

话未多少说，不逊一起来看现场演示下场。不逊

先来段倒装 prompt：

不光关键信息“北京使命”放在了最后，不逊公积金详细是不逊在哪里交的也不昭示。

但新版文心一言残缺不被这些小陷阱坑到，不逊顺遂给出了精确谜底。不逊

天生方面，不逊就地剪出一整段数字生齿播视频，不逊绝不难题：

解起数学题来也为非作恶，不逊可能说是不逊家长教育作业神器了（doge）。

新版文心一言还现场写起了武侠小说，不逊纵然不断削减人物脚色、不逊削减戏剧矛盾，也不会泛起影像凌乱、前言不搭后语的情景：

如斯展现，着实是让现场不雅众 high 了一把。

文心大模子 4.0 相关话题，也赶快被国内外网友们热议起来。

据现场介绍，比照线上 3.5 版本的文心一言，文心大模子 4.0 后退清晰：仅 9 月启动小流量测试这以前的一个月，就又提升了 30%。

那末，下场来了：文心大模子 4.0 真有这么好？详细与 GPT-4 相差多少多？

当初，文心大模子 4.0 已经开启邀测，量子位也在第一光阴拿到了测试资历。

咱们直接实测走起。

取患上测试资历后，切换到文心大模子 4.0 ，就能开始顽耍了。

比照文心大模子 3.5 刚进去的时候，文心大模子 4.0 如今已经进化出了更多功能，光是插件就有 8 个，搜罗一镜流影（翰墨转视频）、说图解画（看图语言）、E 言易图（可视化数据合成）等。

这些插件还可能逍遥组合，来实现更重大的使命。

baidu谢世界大会现场，重点演示的仍是文心大模子 4.0 的图文创作、数理逻辑推理等合勤勉用。那咱们仍是老模样，从更根基的角度动身，测测它的四大“根基功”——

清晰、天生、逻辑以及影像能耐。

清晰能耐，特意是中文清晰能耐

第一波，先来看看文心大模子 4.0 的清晰能耐。

这里咱们主要考考它应答“语言陷阱”的能耐，以及收集段子的“识别力” 。

先来其中文十级能耐测试题，考考大模子事实懂不懂“真的假的”是甚么意思。

文心大模子 4.0 的回覆很简洁，直接给出谜底。

GPT-4 则要每一句话都子细合成句意，最后再给出回覆：

尽管更子细，但总感应有点像是在子细做中文测试的歪果仁（doge）。

再来上点难度，“小偷偷偷偷工具” 。

文心大模子 4.0 很快拆解出了“小偷”、“偷偷”以及“偷工具”三个词，get 到了这句话的意思：

不外，GPT-4 反而一头“栽”进了这个陷阱中，以为中间的两个“偷”也是动词，最后还漏了一个偷……

审核完语言陷阱后，再来看看双方对于收集段子的清晰。

针对于“哪李贵了”这个外乡梗，文心大模子 4.0 很快给出了谜底，人物使命都直不雅：

GPT-4 假如不开搜查，会 get 不到 2022 年 1 月之后的梗：

但假如掀开搜查，很快也能“与时俱进”，给出这个下场的谜底：

同理，咱们也试了试从外洋传入国内的梗。

文心大模子 4.0 以及 GPT-4 都能回覆进去，文心大模子 4.0 更提要一些，GPT-4 则是直接搬运了一套百科（更详细，但 tokens 也更贵💰……）：

收集段子测评看下来，文心大模子 4.0 以及加了搜查的 GPT-4 可能说是各有千秋。

多模态天在行腕

那末接下来这波，就要魔难当下最受关注的大模子多模态天在行腕了。

先来试试图像天在行腕，特意审核一下对于新诗“孤舟蓑笠翁，独钓寒江雪”的清晰。

文心大模子 4.0 很快给出了 4 张图像，气焰以及根基意境都比力适宜：

GPT-4 也运用 DALL・E 3 画出了 4 幅画，同样画风各异：

这一次双方打了个平手。

那末视频天生呢？这里咱们调用一下文心大模子 4.0 的自带插件，本想着只是天生一段落叶剪辑，没想到连文案以及字幕语音都配好了，实现度很高那种：

GPT-4 本体当初还不反对于天生视频，需要借助外部插件（如 Capcut）实现这一功能。

逻辑能耐

而后，就到了咱们喜闻乐见的数学合计 + 逻辑推理能耐测试了。

文心大模子 4.0 说是重点降级了数学合计能耐，咱们也不客套，直接上难倒一片大模子的 Old McDonald 下场：

文心大模子 4.0 一口吻列出了 4 个未知数（doge），但解题历程仍是比力松散的，最终谜底也不下场。

此前，咱们曾经将这个下场喂给 Claude、ChatGPT 等一众大模子，“横向评测”过一波它们的数学能耐，当时惟独 GPT-4 能做进去。

接下来，直接上弱智 benchmark，考考逻辑推理能耐。

第一个下场，文心大模子 4.0 以及 GPT-4 都很快给出了精确谜底：

第二个下场，双方的回覆也很快，文心大模子 4.0 还顺口给出了“七分陆地三分陆地”的地舆题背诵口诀：

看起来双方的数学、逻辑都不错，点个赞。

影像能耐

狂语言模子公认的评判尺度之一，是多轮对于话能耐。GPT-4 的多轮对于话已经有良多测试了，咱们再来重大看看文心大模子 4.0 的下场。

先来解读一下长论文，没甚么下场：

以这个为主题写一首诗歌，特意让它改为英文，也能 hold 住：

试试让它改患上押韵一点，no problem ：

最后再来提问一下诗歌中用到的 Transformer 知识点，并挑出其中的某个知识点要求批注道理，也信手拈来：

此外，试着将上文中的知识点用“它”替换，文心大模子 4.0 同样能承接上文的对于话，并给出相关知识回覆。

看来不论是长文本解读、仍是多轮对于话，可能说都是难不倒文心大模子 4.0 了。

附加题

正直测试竣事，咱们最后整点乐子（doge）。

这段光阴，一道怪异的考题又被拎进去，在小红书等社交媒体上“难倒众人”，题面是这样的：

乍一眼还真看不出谜底，不如交给文心大模子 4.0 以及 GPT-4 回覆试试。

文心大模子 4.0 给出的回覆算是有理有据，尽管细看仍有一点 bug，但部份下场不大。

可是当咱们将这个下场抛给 GPT-4 的时候，它先是妨碍了好一会，而后直接被“急出母语”（doge）

翻译一下约莫便是，GPT-4 以为 D 选项是精确的……

咱们再试验一遍。这次 GPT-4 却是用中文回覆了，只不外彷佛开始打起了太极，对于每一个选项，它的回覆都是：

测到这里，无妨做个小小的总结：

部份来看，与 GPT-4 比照，文心大模子 4.0 在综合能耐上简直不落下风，特意是在中文清晰能耐以及通用知识能耐上致使更好。

那末，这样的大模子事实是奈何样炼成的呢？

先来看看文心大模子 4.0 的“自进化”水平。

据baidu CTO 王海峰介绍，大模子展现出的创作、编程、解题、妄想等能耐，实际上都依赖于眼前的 4 大中间根基能耐 ——

清晰、天生、逻辑以及影像能耐。

比照 3.5 版本，文心大模子 4.0 的 4 大根基能耐均有了良多提升，而提升最大的，又要属逻辑以及影像能耐。

其中，逻辑的提升幅度抵达了清晰的近 3 倍，而影像的提升幅度则抵达了清晰的 2 倍多：

以大模子写代码为例。

当初，baidu的良多员工已经用上了大模子写代码运用 Comate，平均代码接管率抵达 40% ，高频用户抵达 60%。

致使如今baidu天天新增的代码中，20% 都是靠 Comate 天生的，比例还在不断削减。

以是，文心一言眼前的文心大模子 4.0 ，事实是奈何样炼成的？

据王海峰展现，中间架构尽管仍是从文心大模子 3.0 以及 3.5 一脉相承，搜罗最后 3.0 的有把守精调、基于人类反映的强化学习，以及 3.5 的知识点增强、逻辑推理增强、插件机制等。

但文心大模子 4.0 的技术改善，可能直接用三个“更”来总结：

磨炼上，当初飞桨平台已经能在万卡算力上运行，基于集群根基配置装备部署、调解零星、软硬件协同优化，反对于大规模晃动高效磨炼；同时，基于可再生磨炼技术中的增量式参数调优，来节约磨炼资源以及光阴。

基于这套技术，自 3 月份以来，文心大模子系列磨炼算法已经累计提效 3.6 倍，周均磨炼晃动有功能逾越 98% ：

数据上，团队建树了一套多维数据系统，从数据开掘、合成、分解标注以及到评估，组成为了一整套“流水线” ，来进一步提升模子磨炼下场。

算法上，则基于有把守、精调、偏好学习以及强化学习等技术，妨碍了多阶段的对于齐，确保大模子能更好地与人类分说以及抉择妨碍对于齐。

在这其中，有两方面很关键的技术细节。

一方面是知识点增强的能耐。

以前大模子可能只在一个阶段做知识点增强，但如今baidu在输入以及输入两方面同时妨碍了知识点增强。

输入先用知识点增强，对于用户输入的下场妨碍清晰，拆解出回覆下场所需知识点，基于搜查引擎、知识图谱、数据库查找知识，天生第一遍服从；

输入再用知识点增强，对于第一遍天生的服从妨碍合成，并用搜查引擎、知识图谱、数据库妨碍“double check”，对于其中有差迟的中间妨碍更正。

另一方面是智能体机制。

《思考，快与慢》这本书中，将认知零星分成零星 1（反映快但易侵蚀）、零星 2（反映慢但更理性精确）。

凭证这个道理，baidu在大模子根基上，进一步研制了零星 2。

也便是说，比照大模子直接给出谜底，如今进一步让它学会清晰、妄想、反思以及进化，这样大模籽实施就能更坚贞、致使实现自我进化，思考历程“白盒化”。

这两大技术细节，也哺育了文心大模子 4.0 水平的飞速提升，致使光是以前一个月的光阴里，就提升了 30%。

这样的技术，也让文心大模子 4.0 的用户以及开拓者人数削减患上飞快。

妨碍当初，文心一言用户规模已经抵达 4500 万人，开拓者抵达 5.4 万人，普遍 4300 多个运用途景，运用数目抵达 825 个，并接入了逾越 500 个插件。

而在技术之外，更值患上关注的是，baidu天下大会上透展现的信息展现，文心大模子 4.0 已经周全重构了baidu的搜查、GBI、文库、网盘、舆图等数十款运用。

为甚么这么说？李彦宏在baidu天下大会现场分享时夸张：

不够为奇，红杉老本在《天生式 AI 进入第二阶段》中同样以为，天生式 AI 市场正在进入“第二幕”：

底层的逻辑着实很重大：底层技术的紧张性不用置疑，但前沿技术想要真正在人们的生涯中缔造价钱，仍是需要经由运用的方式。

假如说，大模子掀起的是人机交互方式刷新的风暴，那末 AI 原生运用，正是纯做作语言交互的详细展现方式。

正如baidu现场所演示的，数据合成如今可能是酱婶的 ——

直接对于恣意数据提问，AI 分分钟就能睁开详细合成，再也不需要家养跨数据库、跨表格合成。

在办公软件如流里，交接出行妄想，AI 超级助手立马就能把差旅机酒布置安妥。

凭证文档天生 PPT，也便是一句话的事，像baidu文库这样的产物，直接化身“破费内容最佳的尽头” 。

咱们同样艰深熟习的网盘、舆图等 App，基于大模子能耐，也泛起出了全新的体验。

好比从网盘视频里直接提取重点内容。

好比在舆图指挥 AI 订餐厅。

baidu此番动手，可能说是直接揭示了一把大模子全方位的运用渗透，揭开了 AI 原生时期大幕的一角。

而baidu“第一个把全副产物用大模子重做一遍”的后手优势，也已经在更大规模内开始展现。

李彦宏泄露，baidu的大模子技术已经运用在制作、能源、电力、化工、交通等实体财富中，17000 家企业已经退出其中，大模子正在成为新型工业化的紧张增长力。

从 3 月份文心一言宣告，到年中文心大模子 3.5 版本更新，再到如今 4.0 惊艳亮相，baidu文心大模子的迭代速率不堪称烦闷速。

这眼前既是国产大模子从技术 demo 到落地运用的强烈相助，也再一次展现了baidu在大模子规模深挚的技术积攒。

而且随着文心大模子 4.0 以及baidu一众 AI 原生运用的亮相，大模子赛场上新一阶段的相助倾向愈发清晰。

正如李彦宏所说：

在此历程之中，不论是国产大模子根基能耐的快捷追赶，仍是 AI 原生运用开拓的自动攻击，都令夷易近意潮汹涌。

AI 原生时期，在种种层面上，都越来越值患上期待了。

广告申明：文内含有的对于外跳转链接（搜罗不限于超链接、二维码、口令等方式），用于传递更多信息，节约甄选光阴，服从仅供参考，IT之家所有文章均搜罗本申明。

分享到：

上一篇： 原创发展联盟首秀便拿下30+两双，马刺可以考虑让他和文班进行搭档？

下一篇： 尘埃落定！浙江队被剥夺亚冠资格悬念揭晓，来看看名记传来的消息哥哥是皇帝，大伯是光绪，奶奶是慈禧，他却非常低调地活到2015年

温馨提示：以上内容和图片整理于网络，仅供参考，希望对您有帮助！如有侵权行为请联系删除！

猜你喜欢

友情链接：

朱孝天Twitter

杜天皓TikTok

王传一Instagram

冯德伦微博

庆余年官网

温碧霞微博

吴奇隆博客

杨一展Instagram

萧敬腾微博

李克勤抖音

陈情令主页

许名杰Twitter

欢乐颂微博

贾静雯Instagram

被嫌弃的松子的一生博客

大明王朝1566Twitter

剪刀手爱德华Weibo

乱世佳人Instagram

[瞎话板]孤掌难鸣！杜兰特近5沙场均30分6篮板4助攻，太阳2胜3负

法甲-李刚仁建功阿什拉夫助攻双响巴黎3-0蒙彼利埃四连胜暂登顶

27分收获奇才生涯首胜普尔直言新三人组威力无限拥有张伯伦身体天赋，NBA历史第一纪录，无人能破

B站与京东深度相助“京火妄想”，助力品牌高效种草

名记玩笑：布罗格登刚签了里奇

16中14送独行侠首败约基奇再把一项纪录收入囊中117秒棍砸45次！初二男生遭五人暴力殴打，其父铁棍反击活活打死

原创雷霆吐槽格林，科尔也感到迷茫！库里赛后兴奋发声，勇士捡漏成功

原创凯尔特人主教练：塔图姆增加了肌肉，也提升了自己的无球能力！

德甲-拜仁4-0多特取联赛四连胜凯恩戴帽领跑射手榜萨内两助攻直播吧2023-11-05 03:24直播吧2023-11-05 03:24