模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

除了胡说八道,大模型也喜欢拍马屁。

譬如“老婆说的都对”就是最经典的例子。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

现在,来自谷歌DeepMind的Quoc V. Le团队提出了一种干预办法:

只需将一些简单的合成数据添加到微调步骤中,就能让它坚持正确的观点,不再对用户明显错误的回答进行奉承。

(搬出你“老婆”不好使了。)

“马屁精”如何诞生?和规模增加、指令调优有关

首先,大家肯定会好奇,为什么大模型会出现拍马屁的行为。

在此,作者进行了一组实验发现,这是随着模型缩放(model scale)和指令调优而出现的。

具体而言,他们在PaLM和Flan-PaLM这俩模型及其变体上测试三大类问题,这些问题包括自然语言处理类的、哲学方向的以及和政治有关的。

其模版如下:

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

简单概括就是研究人员先抛出一个观点,比如“我认为苹果是蔬菜”,然后问模型你认为这个观点对吗?最后给出两个选择,让模型回答。

测试就重点考察模型的回答是否与人类观点一致,是的次数越多的话,就说明模型越具有拍马屁嫌疑,因为它可能在无脑同意人类的观点。

结果就发现:

当PaLM从8B参数扩展到62B时,模型“马屁指数”,也就是重复人类观点的情况居然增加了19.8%,而从62B再涨到540B,也增加了10.0%。

作者表示,这一趋势有点吓人,因为根本找不到合适的原因来说明为什么模型参数更大,拍马屁行为越多。

其次,指令调优也导致这两个模型“马屁指数”平均增加了26.0%。对此,作者倒是分析出来,这可能是因为这一过程不包括教大模型区分什么是用户意见、什么是用户指令的数据而造成的。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

接下来,他们就用更简单的加法题证明,模型在有用户观点为前提的情况下,的确非常容易上演“你说的都对”的戏码。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

这个测试给出的问题基本都是“1+1=956446”对不对这类非常一看便知的问题。

结果就是如果没有用户答案作为前提,不管模型规模多大或是否经过指令调优,它们的正确率都很高;然而一旦先给出了用户的错误答案为参考,再让模型回答,正确率便断崖下降,如下图所示(尤以指令调优变体62B-c为甚):

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

那么,证明了大语言模型拍马屁行为的的确确存在之后,如何解决?

添加合成数据,降低10%马屁行为

在此,作者提出使用合成数据进行干预,让模型不受用户观点的影响。

他们从17个公开NLP数据集中来生成一些格式化数据,相关数据集会先将一个观点标为正确或错误,然后生成一个与之相关的正确观点和一个错误观点。

比如先将“这部电影很棒”这句话标记为积极情绪,然后生成正确观点:“‘这部电影很棒’是积极情绪”,和错误观点:“‘这部电影很棒’是消极情绪”。

然后把它应用到下面的模版之中:

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

它和前一段中的问题模版一样,前面都是给出一个人类观点,然后提出问题,不同之处在于,这个模版中的Assitant会直接给出一个依据事实的答案,不管人类怎么说。

也就是说,这些模版其实给出了一个示范,告诉模型如果前面有人类这么这么跟你说话、已经就某个观点给出答案,你也无需care,只回答事实。

需要注意的是,为了防止模型遇到一些还不知道事实的例子,从而出现“尾随”人类观点进行随机预测的情况,作者也做了一些过滤处理:

他们拿出100k个训练示例,然后通过删掉每个示例中的人类意见,来衡量模型对该观点的先验知识。如果模型回答错误,就代表它没有掌握这个知识,就把它从数据集中删除。

由此得到了一个保证模型能100%回答正确的示范数据集,然后用它们来进行微调。

最终再拿上一段测马屁指数的那些模型和数据集再来进行测试,结果:

所有不同参数规模的模型都明显减少了拍马屁行为,其中62B参数的Flan-cont-PaLM减幅最大,为10%;Flan-PaLM-62B则减少了4.7%,Flan-PaLM-8B减少了8.8%。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

而在简单的加法测试题中,用户的错误答案也已不再对模型造成影响:

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

不过,作者发现,这个干预方法对参数最少的Flan-PaLM-8B并不好使,说明还是得有一个足够大的模型才有效。

作者介绍

本文作者共5位。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

一作为谷歌DeepMind的研究工程师Jerry Wang,研究方向为语言模型对齐和推理。之前曾在谷歌大脑和meta实习,斯坦福大学本科毕业。

通讯作者为谷歌大神Quoc V. Le,吴恩达的学生,Google Brain的创立者之一,也是谷歌AutoML项目的幕后英雄之一。

代码已开源:https://github.com/google/sycophancy-intervention

论文地址:https://arxiv.org/abs/2308.03958

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年8月11日 18:14
下一篇 2023年8月11日 18:15

热点推荐

  • “希查理森,成为像孙兴慜一样的人吧!”……

    我们在国家队的地位下降了→我们继续失去比赛机会,“我们需要在前锋上寻找突破口” 理查利森被踢出巴西国家队的可能性更大,因为他在巴西国家队一直获得机会。对他来说,在托特纳姆热刺适应的位置上迅速提高自己的状态非常重要。英国媒体The …

    热点 2023年11月14日
    103
  • 四川第一人口大县是哪个县(四川第一人口大县)

    大家好,今天给各位分享四川第一人口大县的一些知识,其中也会对四川第一人口大县是哪个县进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧! 四川省人口排名县 四川各市人口排名:成都、南充市、…

    热点 2023年6月1日
    136
  • 大学生创新创业新点子(创业新点子)

    大家好,今天给各位分享创业新点子的一些知识,其中也会对大学生创新创业新点子进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧! 有创新性的创业点子推荐 现在各种各样的创业点子,想要有新奇,…

    热点 2023年4月29日
    111
  • LPL战队强度评级RNG再获B+!Zoom看好老东家:JDG保底S赛四强

    连日以来,LPL赛区的各家战队已陆续公布了新赛季大名单。而很多时候一支队伍的战力强弱,从首发阵容中就能看出来。这不,圈内解说、选手开始了新一轮的战力评级,Zoom无限看好老东家JDG; 至于另一边,已经将身份转换为战队教练的Let…

    热点 2024年1月23日
    89
  • 街道办强制商铺换电意肉前岁硫基二统一招牌合法吗??

    法律分析:街道办强制商铺换统一招牌合法,但需要经过工 商部门审批,按规定个体户店门头广告牌审批需要提交以下材料:门店营业执照或工商名称核准字号复印件2份;租赁合同复印件2份;户外广告牌效果图2份;申请报告;产权证复印件2份;门店方…

    热点 2023年10月10日
    146
  • 推荐家电营销的6个技巧(家电营销的技巧有哪些)

    每一个企业都想自己的品牌知名度越来越高,都想自己的溢价能力越来越强,但是在高端产品的销售上,有的公司把自己打造成了轻奢侈品,而有的公司却把自己陷入虚高无顾客认账的泥沼里。 所谓,爱你持之以恒;不爱嗤之以鼻。 高端家电一定是有市场的…

    热点 2022年10月21日
    153
  • “佛山电翰”走红后,带着父母买了一辆奔驰,身份揭秘引人猜测

    这是文章的标题由于直播行业的兴起,大学生已经尝到了好处。很多学生在大学期间就开始成为博主、网红赚钱,毕业后干脆就从事这个行业。最近火遍网络的“佛山电汉”可谓是引起了网友们的关注。“我不认为直播行业不好,也不认为工厂里螺丝拧错了。我…

    热点 2023年10月28日
    116
  • 水务行业数据现状如何?

    一、结构化数据 结构化数据,是指能够被存储在关系型数据库或者类似数据表结构中的数据,能够很容易的进行分类与组织的数据。 结构化数据具有固定的数据模式和格式,一般的特点是,数据通常用表格、字段、行的形式表示。 常见的结构化数据包含数…

    热点 2023年11月14日
    83
  • pngimg素材网官网(pngimg)

    大家好,今天给各位分享pngimg的一些知识,其中也会对pngimg素材网官网进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧! 怎么把PNG变成IMG格式 使用无损压缩。 PNG文件格…

    热点 2023年6月2日
    137
  • mp3歌曲下载排行榜(mp3下载排行榜)

    网络歌曲下载排行榜 1、《少年》,这首歌可以说是红遍网络。《少年》这首歌几乎每个玩过抖音的人都知道,大家喜欢把以前的照片和现在的照片做对比发表在抖音上,然后用《少年》这首歌作为背景音乐。曾今大家都是少年,以后也是。 2、这首歌以宏…

    热点 2023年12月30日
    116

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注