当前位置:首页 >热点 >用暂停token重新训练大模型,AI学会三思而后行

用暂停token重新训练大模型,AI学会三思而后行

2024-04-29 04:22:37 [焦点] 来源:恒易快讯网
梦晨 发自 凹非寺

让ChatGPT给出答案之前多想想步骤,用暂就能提高准确率。重新

那么能不能省去提示词,训练型AI学行直接把这种能力内化在大模型里呢?

CMU与谷歌团队的大模新研究,在训练大模型时加入暂停token来实现这一点。而后

实验中,8项评测成绩提升,重新其中SQuAD的训练型AI学行EM得分提高18%,CommonSenseQA提高8%,大模GSM8k中的而后推理任务也提高1%。

研究者Jack Hack表示,自己不久前就提出类似假设,重新很高兴看到它被验证。训练型AI学行

英伟达工程师Aaron Erickson表示,是而后不是和人类说话时加入“嗯嗯啊啊”是一个道理?

预训练微调都加入暂停token

整个研究基于一个简单的想法:

在输入序列后面追加一系列(暂停token),从而延迟模型输出下一个token。

这可以给模型额外的计算时间来处理更复杂的输入。

作者不仅在下游任务微调时引入,还在预训练时就随机在序列中插入,让模型在两阶段都学习如何利用这种计算延迟。

预训练阶段,在语料库中随机插入一定比例的暂停token到输入序列,进行标准的自回归预训练。但计算损失时会跳过暂停token的预测。

下游任务微调时,输入中也追加一定数量的暂停 token,然后对目标序列进行自回归预测,同时微调模型参数。

推理阶段也追加相同数量的暂停token,但忽略模型输出直到最后一个暂停token,然后开始提取答案。

实验使用了标准的Transformer纯Decoder模型,分为130M参数和1B参数两个版本。

其中暂停token只增加了1024个参数,也就是它本身的embedding大小。

在9个不同任务上的实验表明,仅在微调阶段引入暂停token的效果并不明显,有些任务不会提升。

但如果在预训练和finetune阶段都使用暂停token,大多数任务上都获得显著提升。

论文还探究了暂停token的数量、位置等关键超参数。发现对于不同的模型通常存在一个最优的数量。

最后作者也提出,这项工作也有不少局限性。

由于暂停token增加了模型计算量,与其他方法对比是否公平还有待讨论

新方法需要重新预训练,在实际应用还有一定困难

对具体工作机制还缺乏深入理解

推理时如果暂停token数量为0,模型表现仍然不佳

搜索引擎You.com的CEO表示,接下来是不是应该把所有提高人类认知表现的技巧都对大模型试一试?

现在已经有了“一步一步地想”和“深呼吸”。

也许下一个爆款论文就是教大模型带着问题睡一觉或者更离谱的健康饮食、注意锻炼。

(责任编辑:焦点)

    推荐文章
    • 汤尤杯中国男、女队同获“开门红”

      汤尤杯中国男、女队同获“开门红”新华社成都4月27日电(记者田光雨、许仕豪、陈地)2024年道达尔能源汤姆斯杯暨尤伯杯决赛27日在成都打响。中国男、女队在小组赛均以5:0分别战胜澳大利亚队和新加坡队,双双迎来“开门红&r ...[详细]
    • 温岭杀医案引发深思:关注了病情却忽视了感受

      温岭杀医案引发深思:关注了病情却忽视了感受昨日,温岭的医护人员们悼念和送别遇难的同事  核心提示 浙江温岭患者杀医案致1死2伤,一周以来中国连发三起医疗暴力事件,刺痛国民神经。  昨日,蒙难的医生王云杰已被火化出殡,当天,上百医护人员聚集医院 ...[详细]
    • 31省区市昨日新增51例本土确诊 12月11日全国疫情最新情况通报

      31省区市昨日新增51例本土确诊 12月11日全国疫情最新情况通报  截至12月10日24时新型冠状病毒肺炎疫情最新情况  12月10日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例87例。其中境外输入病例36例(广西15例,山东7例,上海 ...[详细]
    • 中国天眼已开启“多出成果”“出好成果”阶段

      中国天眼已开启“多出成果”“出好成果”阶段  新华社贵阳12月20日电 20日上午,2021年度FAST运行和发展中心年终总结会在贵州省平塘县中国天眼(FAST)观测基地举行。  据了解,目前利用FAST望远镜观测产生的科学成果不断涌现。FA ...[详细]
    • 布林肯将七赴中东

      布林肯将七赴中东观察者网讯)据美国国务院消息,美国国务卿布林肯将于4月29日至30日访问沙特阿拉伯,会见地区合作伙伴,讨论目前为实现加沙停火和释放以色列人质所做的努力。彭博社称,这是布林肯自去年10月7日新一轮巴以冲 ...[详细]
    • 王方杰:做官是怎样的一种高危行业?

      王方杰:做官是怎样的一种高危行业?陕西一个省级部门官员表示:“做官员真的是高危行业。”这名官员说,疑神疑鬼成了一种生活方式,很多同事害怕他们的面孔会出现在网络上,毁掉他们的职业生涯。(6月20日《潇湘晨报》)  随着反腐力度的加大,网 ...[详细]
    • 7000万的招待费怎能说“不奇怪”?

      7000万的招待费怎能说“不奇怪”?  今年湖北两市披露业务招待费的1628家公司中,业务招待费用最多的为葛洲坝集团,额度7311.6万。“葛洲坝体量这么大,招待费高不奇怪。”对于外界的质疑,公司相关负责人表示。(9月6日《长江商报》) ...[详细]
    • 中国科协:到2025年推动每个地级市建有1座科技馆

      中国科协:到2025年推动每个地级市建有1座科技馆  新华社北京12月23日电 中国科协日前印发的《现代科技馆体系发展“十四五”规划(2021—2025年)》提出,加强科技馆体系基础设施建设,到2025年推动每个地级市建有1座科技馆。  规划指出,“ ...[详细]
    • 江西:五一期间江西高速车流将超836万辆次 新能源车占比近三成

      江西:五一期间江西高速车流将超836万辆次 新能源车占比近三成4月26日,江西省交通监控指挥中心预测,今年五一劳动节期间,江西省高速公路交通流量将高于历史同期,预计出口车流量约为836.46万辆次日均出口车流量约167.29万辆,同比增长8%),其中新能源车占比 ...[详细]
    • 习近平谈改革:中国决不能出现颠覆性错误

      习近平谈改革:中国决不能出现颠覆性错误  闽南网10月9日讯 国家主席习近平7日在印尼巴厘岛出席亚太经合组织工商领导人峰会,并发表《深化改革开放共创美好亚太》的重要演讲,强调中国经济发展态势良好,中国将坚持改革开放正确方向,做到改革不停顿 ...[详细]
    热点阅读