2023年09月01日:SELF-INSTRUCT: Aligning Language Models with Self-Generated Instructions

  • 主页 /
  • 通知公告 /
  • 通知公告

2023年09月01日:SELF-INSTRUCT: Aligning Language Models with Self-Generated Instructions

【报告内容】

汇报人:蔡子杰

汇报单位:福建理工大学

主题:《SELF-INSTRUCT: Aligning Language Models with Self-Generated Instructions》

1、Introduction

2、Method

3、Experiments

4、Conclusion

【报告总结】

1.待解决的问题描述

人工评估方式存在主观性,因此评级会具有差异性。

2.相关创新方案

通过使用一种几乎不需要人工注释的方法就可以生成大量用于语言模型指令微调的指令数据。

3.实验总结

实验数据表明在零样本泛化表现上,使用经过本文方法创建的指令数据集微调后的模型,指令跟随能力相较于其他方法有明显的提升。并且,在文章创建的指令数据上进行的实验证明了该方法可以使微调后的GPT3模型的指令跟随能力接近InstructGPT.

4.未来工作

完善人工评级系统,尽量使主观性降低,例如报告评级中所有人的结果,若集中于某个评级,则该评级可信度更高。

报告时间:2023年090119:30

腾讯会议:371 3868 6615

点我下载本讨论课相关文献或PPT吧~(提取码:iipr)