DeepMind推出AI聊天机器人Sparrow，可通过谷歌搜索来回答问题

2022-09-25 10:48

Alphabet 旗下人工智能实验室 DeepMind 的一篇新论文显示，制造一个好的人工智能（AI，Artificial intelligence）聊天机器人的诀窍，可能是先让人类制定一系列不可打破的铁律，然后使该模型利用互联网搜索寻找证据，支持其主张或回答。

在近日发表的一篇新的未经同行评议论文中，DeepMind 发布了一种使用其大型语言模型 Chinchilla 训练的人工智能聊天机器人 Sparrow。

（来源：DeepMind）

Sparrow 的设计目的是与人类交谈并回答问题，同时实时使用谷歌搜索或有关信息来支持它的答案。

根据人们对这些答案有用与否的回应，再使用强化学习算法进行训练。该算法通过反复试验（试错）来学习，以实现特定的目标。

该系统旨在推动人工智能发展成为可以与人类对话，但却不会产生诸如让人们伤害自己或他人的严重后果。

大型语言模型生成的文本看起来就像是人类写出来的。它们正日渐成为互联网基础设施中的重要组成部分，被用于总结、构建更强大的搜索工具，或者是为客户服务的聊天机器人。

但是，这些模型是通过从互联网上抓取大量数据和文本来接受训练的，这不可避免地包含许多有害的偏见。

只需要一点诱导，它们就会生产“有毒”的或歧视性的内容。在一个旨在与人类对话的人工智能工具中，其结果可能是灾难性的。

一个没有适当安全措施的对话式人工智能，可能会对少数群体说出带有冒犯性的话语，或者建议人们喝漂白剂来对抗病毒。据悉，那些开发对话式人工智能系统的公司，已尝试使用许多技术来使模型更安全。

著名大型语言模型 GPT-3 的创造者 OpenAI，以及人工智能初创公司 Anthropic 已经在利用强化学习，将人类的偏好融入到他们的模型中。Meta（原 Facebook）的人工智能聊天机器人 BlenderBot 通过在线搜索来完善其答案。而 DeepMind 的 Sparrow 将所有这些技术整合在一个模型中。

据介绍，DeepMind 向人类参与者展示了该模型对同一问题给出的多个答案，并且还会问他们最喜欢哪一个。

然后他们被要求判断这些答案是否可信，以及 Sparrow 是否使用了适当的证据支持这个答案，比如提供信息来源的链接。

比如，该模型通过使用从互联网上检索到的证据，能够在 78% 的情况下对事实问题进行合理的回答。

在制定这些答案时，它会遵循由研究人员规定的 23 条规则，比如不提供财务建议、不发威胁性文字、不声称自己是一个人。

DeepMind 安全研究员杰弗里·欧文（）说，这种方法与之前的不同之处在于，DeepMind 希望达到“对话的长期安全”。

他说：“这意味着我们不期望这些模型面临的问题——错误信息或刻板印象——乍一看是显而易见的，我们想详细讨论它们。”

非营利性人工智能研究实验室 Cohere for AI 的负责人萨拉·胡克（）说，利用人类偏好来优化人工智能模型学习方式的想法并不新鲜。

但认为，这些改进令人信服，同时展示出在大型语言模型环境中，以人为引导的方式优化对话代理有明显的好处。

人工智能初创公司 Hugging Face 的研究员都维·基拉（）说，Sparrow 是“很好地遵循了人工智能总体趋势的下一步，我们正在更努力地改进大型语言模型的部署安全性。”

但在这些对话人工智能模型被部署到社会中之前，还有很多工作要做。

比如，Sparrow 仍然会犯错误，这个模型有时会所问非所答或给出随机答案。那些有毅力的参与者也可以打破人为定下的规则，这样的情况约有 8%。与老款模型相比，这仍是一个改进：即打破 DeepMind 老款模型规则的频率，是 Sparrow 的三倍。

说：“比如（用大模型来）提供医疗和财务建议，那么对许多人来说，8% 可能仍然是一个令人无法接受的高失败率。”

这项工作也仅建立在英语模型上，“而我们生活在一个技术必须安全和负责任地为许多不同的语言服务的世界里，”他补充道。

指出的另一个问题是：“依赖谷歌来寻找信息，会导致难以发现的未知偏见，因为所有信息源都是封闭的。”

支持：Ren

原文：

https://www.technologyreview.com/2022/09/22/1059922/deepminds-new-chatbot-uses-google-searches-plus-humans-to-give-better-answers/

参考：

https://www.deepmind.com/blog/building-safer-dialogue-agents

THE END

责任编辑：李斌

相关阅读

“萌警”出街，警用巡逻机器人湖南衡阳街头24小时执勤2022-10-08
明星科技公司为什么突然热衷造人形机器人？2022-10-07
扫地机器人最终形态是什么样？科沃斯X1 PRO OMNI有话说2022-10-04
特斯拉人工智能日：人形机器人“擎天柱”首次亮相，预计售价低于2万美元2022-10-02
安防机器人基地来了！大兴区三季度推进16个重大项目开工2022-10-01
双足机器人的技术攻坚和落地2022-09-28
工业机器人有哪些系统组成？2022-09-26
特斯拉发AI日邀请函：提及FSD、机器人、Dojo2022-09-25
人工智能，涉及领域众多，未来或许会出现人工智能机器人学校2022-09-18
KUKA发布弧焊机器人2022-09-16

展会预告

新品

中维世纪新品 | 这样的火眼金睛，才够格做“黑悟空”“天命人”
中维世纪又推智能场景机!此次场景机在看清电子屏幕的基础上，增加字符提取与超阈值报警功能，超清视野与灵…
中维世纪新品 | 这样的火眼金睛，才够格做“黑悟空”“天命人”
思特威推出具有AOV快启功能的5MP高分辨率IoT图像传感器SC535IoT
思特威推出0.7微米5000万像素图像传感器SC5000CS
云天励飞发布新一代AI芯片DeepEdge10
爱芯元智发布新一代IPC SoC芯片AX630C和AX620Q

访谈

做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…
博思高邓绍昌：乘产品创新及客户服务之舟，在市场变革中逆风飞扬

11月24日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会，在深…

企业

圣恩科技：守护城市生命线
树立行业标杆，讲好中国故事，传递中国声音，充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神。…
佳都科技“数智堤坝”助力地铁安全度汛
高新兴与麒麟软件达成战略合作，加速国产化应用生态布局与落地
圣恩科技：守护城市生命线
熵基科技在多模态BioCV技术领域取得新突破
捷顺科技发布“停充一体”标准，打造一站式停充服务，推动停车充电行业规范发展