龙猫数据线下标注工具自推出以来便受到众多用户喜爱。凭借强大的标注功能、简洁的任务配置方式、方便的用户管理,迅速成为众多从业者任务试标和正式标注的利器。最近的更新迭代在图像、音频标注基础上增添了NLP文本标注功能,可以方便进行文本内容的标签化处理。
NLP自然语言处理作为AI一个分支,在多个领域都有重要应用,例如机器翻译、语音识别、情感分析、问答系统以及聊天机器人。对于只能理解0和1的计算机来说,理解人类充满模糊性的话语非常有挑战,而这也正是NLP技术的价值所在:根据句子中词汇的位置和功能将文本转换为机器可以理解的内容组件。
NLP中比较重要的是词汇嵌入技术,指的是每个词都可以转换为一组数字,也即一个N维向量,用于存储有关词汇含义的信息。每个词汇都分配有唯一的向量,但相似的词汇最终会获得彼此更接近的值。例如,词汇“开心”和“高兴”的向量比“开心”和“难过”的向量具有更高的相似性。所以进行向量距离计算之后,会发现“ 开心”和“高兴”的向量距离更近。
如何获得文本中词汇某个维度的信息?自然离不开数据标注,为某个词汇(或句子)打标签正是标注师们擅长的事情。好用的NLP标注工具应具备两个特征:标签选择方便,属性选择可扩展。这也是龙猫NLP标注工具的设计初衷。从易用性来说,标注师用鼠标划选词汇后即可弹出属性选择框,方便简洁;从可扩展来说,文本标注界面右侧支持自定义设置多级多类选择、填空题,可满足几乎所有NLP文本标注需求。
标注任务的简洁并不以任务设置的复杂为代价。在线下标注工具中,只需简单三步即可设置出完善的NLP标注任务。
1 创建项目
在标注系统2.0——线下任务管理进行创建新项目,项目类型选择文本标注nlppage即可。
2 配置标注方式
点击配置标注方式,增加新的文本标签,配置的标签将以不同颜色进行展示。之后填写所需调用的文本标注方式 ID ,ID是在标注系统2.0——文本标注方式管理内添加选择填空题后获得。
3 数据管理与项目授权
支持直接上传多类文本数据,也可以使用龙猫小工具进行批量上传。项目授权通过输入龙猫ID实现,只有授权用户才能看到标注内容并提交标注答案。
我们提供的服务
我们服务的客户
标注工具_龙猫线下标注工具新功能:NLP文本标注
最新推荐文章于 2021-07-30 01:47:51 发布