RLHF-Label-Tool-simple:偏好数据集标注工具RLHF-Label-Tool的简化版

RLHF-Label-Tool-simpleRLHF-Label-Tool的一个简化版。RLHF-Label-Tool是一个偏好数据集标注工具。

截图

安装依赖

  • Python 3.x
  • 安装依赖包:pip install -r requirements.txt

快速开始

  1. 待标注的数据集文件是input_file.jsonl。里面的数据如下:
{"question": "How are you doing?", "response": ["I am good", "I am bad","Terrible","Mind your own business"],"reference":"Normally the answer should be nice."}
{"question": "who are you?", "response": ["LLM", "Apple","Banana","Sea"], "reference":"This chatbot should be a robot or something."}

请按上述格式将此文件替换成你的待标注数据集,文件位置和命名保持不变。

  1. 当前目录下,运行下面命令
streamlit run app.py --server.port 8080
  1. 每条数据只能选1个Accept和1个Reject,假如全部选dismiss,这条数据会被丢弃,除非你再改回来。
  2. Save,结果保存为/data/output_result.jsonl

贡献与许可

致谢:https://github.com/SupritYoung/RLHF-Label-Tool

本项目基于 MIT License 进行发布和授权。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值