汇总!ChatGPT、RLHF相关最新知识点

资源名称内容简介链接标签说明
Awesome RLHF (RL with Human Feedback)人类反馈强化学习(RLHF)前沿研究论文集仓库,包含最新Papers、Codebases、Blogshttps://github.com/opendilab/awesome-RLHFRLHF资源质量较高,包含最近RLHF论文、相关项目和博客
Transformer Reinforcement Learning XtrlX 是一个分布式训练框架,从头开始设计,专注于使用提供的奖励函数或奖励标记数据集通过强化学习微调大型语言模型。https://github.com/CarperAI/trlxRLHF开源训练框架
哈工大 ChatGPT 调研报告ChatGPT 调研报告https://aimg8.dlssyht.cn/u/551001/ueditor/file/276/551001/1678415058523571.pdfChatGPT资料汇总
Awesome-ChatGPTChatGPT资料汇总学习,Star 3K,包含文心一言内容介绍https://github.com/dalinvip/Awesome-ChatGPTChatGPT资料汇总
awesome-chatgptEverything about ChatGPThttps://github.com/OpenMindClub/awesome-chatgptChatGPT资料汇总
awesome-open-gpt/gpt相关开源项目合集Collection of Open Source Projects Related to GPT,GPT相关开源项目合集、精选https://github.com/EwingYangs/awesome-open-gptChatGPT资料汇总
Awesome Totally Open ChatgptA list of totally open alternatives to ChatGPThttps://github.com/nichtdax/awesome-totally-open-chatgptChatGPT可代替的开源项目质量较高,包含大量与Chatgpt类似的模型开源项目
Awesome Prompt EngineeringPrompt Engineering focus on Generative Pre-trained Transformer (GPT), ChatGPT, PaLM etchttps://github.com/promptslab/Awesome-Prompt-EngineeringPrompt Engineering质量较高,包含大量prompt技术论文
ChatGPT技术路线分析ChatGPT、GPT4技术介绍,可代替chatgpt的十几个开源平台介绍https://zhuanlan.zhihu.com/p/615331483ChatGPT、GPT4
ChatGLM-RLHF对ChatGLM直接使用RLHF提升或降低目标输出概率Modify ChatGLM output with only RLHFhttps://github.com/Miraclemarvel55/ChatGLM-RLHFChatGLM-RLHF
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值