机器学习领域中使用的中文开源隐私政策数据集有以下几个比较著名的:
中文隐私政策数据集(Chinese Privacy Policy Dataset):由香港中文大学提供,包含了来自中国大陆网站的隐私政策文本,可用于机器翻译、信息提取和摘要生成等应用。
中文网站隐私政策语料库(Chinese Website Privacy Policy Corpus):由北京师范大学提供,包含了超过 9,000 个中文网站的隐私政策文本,可用于自然语言处理、信息提取和文本分类等应用。
中文移动应用隐私政策数据集(Chinese Mobile App Privacy Policy Data