巨鲨出海
免费使用

文心一言来了!李彦宏:百度是全球大厂中第一个做出来的!

海外资讯

2023-03-17 11:02

对标 ChatGPT,「文心一言」重磅发布!

对于昨日 GPT-4 的意外发布,相信多数人都有如下想法:


1、多模态大模型 GPT-4 真的很强大!


2、恰好赶在了文心一言发布前夕,百度要如何应对压力?


蓄势了一个多月,承载着无数人或期盼或好奇的目光,“国产版 ChatGPT”「文心一言」今天终于正式亮相!


“「文心一言」并不完美,大家想要将其对标 ChatGPT,甚至是 GPT-4,但放眼全球大厂,百度是第一个做出来并真正发布出来的”,李彦宏说道。


“十月怀胎,一朝分娩”,那么接下来,就让我们开始这场万众期待的震撼发布,共同揭开「文心一言」的神秘面纱。



百度在大厂中第一个做出来的「文心一言」,实力几何?


在发布会伊始,对于外界频频问及的“为什么现在发布,百度是否真的做好了准备”等疑问,百度 CEO 李彦宏在开场进行了回应:


“过去多年,百度一直在进行 AI 技术的研究与研发。文心大模型首个版本在 2019 年便已发布,文心一言只是过去多年研发成果的延续。之所以现在发布,是因为现在市场有强烈的需求,包括百度从搜索、智能云到自动驾驶,再到客户、用户,都需要这样的技术。同时,大模型只有发布了,才会有用户反馈,只有通过不断地反馈,才能加速模型自身的迭代。”


紧接着,李彦宏就带着 5 个 Demo “炸场”,让大众一饱眼福。




(1)多模态生成


如果说昨日 GPT-4 带着多模态出现,用一张草图生成一个网站,让众多程序员感到惊艳,那么今天的「文心一言」在覆盖多种模态方面做得更为全面,可用文字生成图片、音频(方言)、视频等多个维度。




不过目前,由于生成视频的成本比较高,百度尚未对所有用户开放,未来会逐步接入。


(2)数理推算


「文心一言」还具备了一定的思维能力,能学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,「文心一言」能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。



同样,现阶段「文心一言」在这方面准确率并不是 100%:“我们还需要给它更多的时间来学习和成长。”


(3)文学创作


在回答事实性问题时,生成式 AI 产品时常会出错,而「文心一言」延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。不论是总结《三体》的核心内容还是续写《三体》,「文心一言」都展现了其优越的总结分析能力和内容创作生成能力。

(4)中文理解


作为扎根于中国市场的大语言模型,「文心一言」具备中文领域最先进的自然语言处理能力,甚至可以理解“洛阳纸贵”并写出“藏头诗”。


「文心一言」能在中文领域领跑,相对应的,它对英文语种、代码场景的训练还不够多,这也是百度接下来加紧训练和完善的方向。


(5)商业文案创作


在商业文案创作上,「文心一言」也可以帮企业起名字、写 Slogan、写新闻稿等。




AI 要写好一篇稿子,除了要能准确理解用户意图,还要有清晰的表达能力——这背后有一个必要基础,那就是庞大的数据规模。「文心一言」的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及 5500 亿事实的知识图谱。基于此,李彦宏指出:“这让百度在中文语言的处理上,能够处于独一无二的位置。”


背后的技术


百度 CTO 王海峰表示,「文心一言」是新一代知识增强大语言模型,是在 ERNIE 及 PLATO 系列模型的基础上研发的。


早在 2019 年 3 月,百度就发布了文心大模型 ERNIE 1.0,当时的文心 ERNIE 已经用上了知识增强的概念。同年 12 月,ERNIE 在自然语言处理领域权威数据集 GLUE 中登顶榜首,以 9 个任务平均得分首次突破 90 大关刷新该榜单历史。到了 2021 年,ERNIE 迭代至 3.0 版本,并刷新了 54 个中文 NLP 任务基准,其英文模型在国际权威的复杂语言理解任务评测 SuperGLUE 上,以超越人类水平 0.8% 的成绩登顶全球榜首。


百度研发的文心 PLATO 更是全球领先的开放域对话大模型,具备多轮流畅的聊天能力,并让对话具有人格属性,包括人设稳定性、知识增强、跨模态对话、情感抚慰、主动对话、长期记忆等。


王海峰指出,「文心一言」的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE 和 PLATO 中也已经有应用和积累,在「文心一言」中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是「文心一言」未来越来越强大的基础。



李彦宏预测大模型时代的三大产业机会


微软引入 OpenAI 的 ChatGPT API 接口之后,紧接着便推出了新版 Bing,Google 也发布了 Bard 大模型,欲开启属于人工智能时代的搜索引擎竞争。那么对于百度而言,「文心一言」的到来,会有什么样的不同?


在李彦宏看来,「文心一言」能够影响的不仅仅是搜索或者互联网公司,而是会影响到每一家公司。他表示,“生成式AI,将催生新产品、新业态,会有很多创业和投资机会。对于大部分创业者和企业来说,真正的机会并不是从头开始做 ChatGPT 和文心一言这样的基础大模型,这很不现实,也不经济。”


为此,李彦宏也针对大模型时代,做了三大产业机会预测:


第一类是新型云计算公司,其主流商业模式从 IaaS 变为 MaaS。「文心一言」,将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。


「文心一言」将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域,都会因此效率大幅提升,并在每一个行业快速形成新的产业空间,助力数字中国的实现。百度智能云将于近期举办新闻发布会。主题围绕文心一言的云服务和应用产品,我们既有公有云服务和也可以做私有化部署,请大家期待。


第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业 Konwhow,调用通用大模型能力,为行业客户提供解决方案。我们的文心大模型,已经在电力、金融、媒体等领域,发布了 10 多个行业大模型。在各行各业都有机会。非常欢迎大家来跟我们合作。


第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D 等场景,已经涌现出很多创业明星公司,他们可能就是未来的新巨头。这里面的机会非常多,可以说每家企业在现在这个阶段都有机会。


李彦宏表示,“我们相信,人工智能会彻底改变我们今天的每一个行业。AI 的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”


「文心一言」将陆续开放


当前,百度表示,3 月 16 日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,今日起,百度智能云面向企业客户开放「文心一言」 API 接口调用服务(https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 )的预约。


最后,对于「文心一言」的发布,我们也询问了一下 ChatGPT 的看法,不过在其答案中,有些数据存在一定偏差。



整体而言,正如李彦宏所说,目前的「文心一言」并不完美,这类大语言模型也还远未到发展完善的阶段。但未来这段时间,它一定会飞速发展,日新月异。


那么你对于「文心一言」的发布,又有什么想说的呢?


出海顾问
管家式陪伴1V1服务, 帮您快速解决出海获客难题!

海外资讯

从一篇博客到最大的SaaS社区,他是如何做到的?

如今人山人海的SaaStr大会,是从2012年的一篇博客起步的。Jason Lemkin通过分享自己成功的创业经验,成就了SaaS行业最大的社区——SaaStr。

海外资讯

微软AI全家桶上新啦,GPT-4进军程序员大本营GitHub

全球最大开发者社区GitHub宣布,推出由GPT-4驱动的编程助手工具Copilot X。由于该社区早在2018年已经被微软斥资75亿美元买下,所以今天的更新也是“微软AI全家桶”的最新篇章。

海外资讯

ChatGPT推出插件,联网自动更新数据,剑指程序员

比技术、比场景理解,还要比速度,入局AI的水位,已经被OpenAI拉高。

跨境电商

出海能救喜茶吗?

喜茶出海5年,战绩如何?

Tiktok

高压5小时,TikTok的生死之战

一场“鸿门宴”。

投融资

硅谷银行暴雷后,新加坡金融科技公司Kredivo获亚洲最大规模融资

他们将会使用这笔资金建设线下网点,并向竞争激烈的印尼数字银行领域扩张。

跨境电商

Temu狂飙,卖家分化:有人利润高过亚马逊,有人一单赚不到一块钱

玩转Temu,先拿捏好供应链。

海外支付

印度和新加坡打通数字支付了

跨境小额汇款在未来是一种必然趋势,完全替代传统的跨境结算体系还需要长期的尝试和实践。

Facebook

16个免费的Facebook营销工具,必须收藏!

Facebook 是电商卖家的一个流量来源。除了 Facebook 自有的工具外,卖家还可借助第三方工具进行营销。

海外资讯

推特需要广告商,广告商却开始不再需要推特

推特的困境。

巨鲨出海
联系我们
© Copyright 2021, All Rights Reserved |   浙ICP备2021027651号    浙公网安备 33011002015963号
扫码关注微信公众号