谷歌的人工智能聊天机器人在第一次演示中失误

来源: theverge

美国时间2月7日,谷歌公开了其的人工智能聊天机器人 Bard — OpenAI 的 ChatGPT 的竞争对手,宣布“在未来几周内更广泛地向公众开放”。但该机器人的开端并不顺利,专家指出 Bard 在其第一个演示中犯了一个事实错误。

谷歌分享的一张 GIF 显示巴德回答了这个问题:“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜的哪些新发现?” 巴德提供了三个要点作为回报,其中一个指出望远镜“拍摄了我们太阳系外行星的第一张照片。”

然而,许多天文学家在推特上指出这是不正确的,第一张系外行星图像是在2004年拍摄的—— 如 NASA 网站上所述。

天体物理学家 Grant Tremblay 在推特上写道:“不是 ~ 好吧,实际 ~ 混蛋 (Not to be a ~well, actually~ jerk),我相信巴德会令人印象深刻,但郑重声明:韦伯望远镜并未拍摄‘我们太阳系外行星的第一张图片’”

加州大学圣克鲁兹分校天文台主任布鲁斯麦金托什也指出了这个错误。“作为一个在韦伯望远镜发射前14年拍摄系外行星的人,感觉你应该找到一个更好的例子?” 他发推文。

在后续推文中,Tremblay 补充说:“我非常喜欢并感谢地球上最强大的公司之一正在使用韦伯望远镜搜索来宣传他们的大型语言模型(LLM)。这是振奋人心的!但是 ChatGPT 等,虽然令人印象深刻,但通常对于自身的错误“非常自信”。未来能看到大型语言模型(LLM)进行自我错误的纠错将会很有趣。”

正如 Tremblay 所指出的,ChatGPT 和 Bard 等 AI 聊天机器人的一个主要问题是它们倾向于自信地将不正确的信息陈述为事实。这些系统经常“产生幻觉”——即编造信息——因为它们本质上是自动完成系统。

他们不是查询已证实事实的数据库来回答问题,而是接受大量文本语料库的训练并分析模式以确定任何给定句子中的下一个单词。换句话说,它们是概率性的,而不是确定性的——这一特征导致一位著名的 AI 教授将它们称为“废话生成器”。

当然,互联网上已经充斥着虚假和误导性信息,但微软和谷歌希望将这些工具用作搜索引擎,使问题更加复杂。在那里,聊天机器人的回答由一台准全知机器接管。

微软昨天演示了其新的人工智能必应搜索引擎,试图通过让用户承担责任来抢先解决这些问题。“Bing 由 AI 提供支持,因此可能会出现意外和错误,”该公司的免责声明称。“确保检查事实并分享反馈,以便我们学习和改进!”

谷歌发言人简·帕克 向The Verge发表了这样的声明:“这凸显了严格测试过程的重要性,我们本周将通过可信度测试者计划启动这一过程。我们会将外部反馈与我们自己的内部测试相结合,以确保 Bard 的回应在质量、安全性和现实世界信息的基础性方面达到高标准。”

分享