科创

会读图、善编码、成绩佳……震惊四座的GPT-4哪里强

当地时间3月14日,OpenAI正式宣布推出大型多模态模型GPT-4。图片来源:美国《时代周刊》

科技日报记者 张佳欣

当地时间14日,美国OpenAI公司宣布正式发布为ChatGPT提供支持的更强大的下一代人工智能技术GPT-4。就在其发布后的第一天,GPT-4在早期测试和公司演示中就以起草诉讼书、通过标准化考试和根据手绘草图建立工作网站的能力震惊四座。

功能更强大的GPT-4有望打破以前的版本,潜在地改变人们使用互联网工作、娱乐等的方式。但这也可能带来更多有关人工智能工具“抢”走“打工人”的饭碗、学术造假以及改变人类与技术关系等挑战性问题。

分析的不仅是文本

就其核心而言,GPT-4最大的变化是它能够处理用户上传的照片。

到目前为止,最令人瞠目结舌的用例之一是来自OpenAI的一个视频宣传片,该视频演示了如何在几分钟内将一幅图变成一个功能强大的网站。演示者将图片上传到GPT-4,然后将生成的代码粘贴到预览中,这一过程展示了其是如何将图片变成一个正常运行的网站。

OpenAI还展示了GPT-4解释一系列图片中的一个笑话(这张图片中的幽默来自将过时的大型VGA连接器插入小型现代智能手机充电端口的荒谬做法),并描述为什么它很好笑。

在另一项测试中,美国《纽约时报》向GPT-4展示了一张冰箱内部食材的图片,并让GPT-4根据食材“制作”了一道菜。

编码变得更容易

一些GPT-4用户之前几乎没有编码知识,在按照该工具提供的说明逐步操作后,他们使用GPT-4重新创建了Pong、俄罗斯方块或贪吃蛇等经典游戏。

据OpenAI称,GPT-4可用所有主要编程语言编写代码。“GPT-4强大的语言能力将被用于从故事脚本、角色创作到游戏内容创作的所有领域。”高德纳咨询公司的分析师阿伦·钱德拉塞卡兰说,“这可能会在未来催生更多独立的游戏提供商”。

与游戏类似,GPT-4可能会改变人们开发应用程序的方式。一名推特用户几分钟内就做了一个简单的绘图应用程序,而另一名用户编写了一个应用程序,每天推荐5部新电影,还能提供预告片和这些电影的细节。

“编程就像学习开车一样,只要初学者得到一些指导,任何人都可以编程。”全球技术情报公司ABI Research的分析师苏连杰表示,“人工智能可在这方面成为一名好老师”。

考试成绩更优异

尽管OpenAI表示,在许多现实世界的场景中,GPT-4的能力都不如人类,但它在各种专业和学术测试中的表现“可与人类相媲美”。

GPT-4最近通过了一项模拟的法学院律师考试,分数位列考生前10%左右。相比之下,之前的版本GPT-3.5的得分位于垫底的10%。

根据OpenAI的数据,GPT-4在美国法学院入学考试、美国研究生入学资格考试、美国高考和许多美国大学先修课程考试中也表现出色。

提供更准确的响应

据OpenAI公司称,与之前的版本相比,GPT-4能够产生更长、更详细、更可靠的书面答复。

最新版本的词汇量从之前的约4000字增加到现在的25000字,甚至可为最独特的场景提供详细的说明。可以说,没有做不到,只有想不到。其回答的内容从如何清洗食人鱼的鱼缸到提取草莓的DNA,应有尽有。

一位早期使用者说,GPT-4还可根据约会资料中列出的问题,提供关于进一步搭讪的具体建议。

精简各行业的工作

法律服务初创公司DoNotPay的首席执行官乔什·布劳德表示,他的公司已经在致力于使用该工具生成“一键诉讼”来起诉电话骚扰者,这是GPT-4改变 人们跨行业工作方式的前兆。可以想象一下,接到一个电话,点击一个按钮,电话就被转录下来,产生了1000字的诉讼书,一旦实现,这将给律师们带来巨大便 利。

与此同时,约会网站Keeper的首席执行官杰克·科兹洛斯基表示,他的公司正在使用该工具来更好地匹配用户。

根据苏连杰的说法,人们可能还会看到联网汽车、远程诊断以及其他以前不可能实现的人工智能应用程序的重大进步。