RLHF-Label-Tool-simple是RLHF-Label-Tool的一个简化版。RLHF-Label-Tool是一个偏好数据集标注工具。
安装依赖
- Python 3.x
- 安装依赖包:
pip install -r requirements.txt
快速开始
- 待标注的数据集文件是input_file.jsonl。里面的数据如下:
{"question": "How are you doing?", "response": ["I am good", "I am bad","Terrible","Mind your own business"],"reference":"Normally the answer should be nice."}
{"question": "who are you?", "response": ["LLM", "Apple","Banana","Sea"], "reference":"This chatbot should be a robot or something."}
请按上述格式将此文件替换成你的待标注数据集,文件位置和命名保持不变。
- 当前目录下,运行下面命令
streamlit run app.py --server.port 8080
- 每条数据只能选1个Accept和1个Reject,假如全部选dismiss,这条数据会被丢弃,除非你再改回来。
- 点
Save
,结果保存为/data/output_result.jsonl
。
贡献与许可
致谢:https://github.com/SupritYoung/RLHF-Label-Tool
本项目基于 MIT License 进行发布和授权。