自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (18)
  • 收藏
  • 关注

原创 BOTSALLY 中文文本辅助自动标注平台

BOTSALLY 的多用户协作标注任务管理和辅助标注平台针对中文文本的标注有下面几个功能: 1,自动辅助切标(分词,词性标注) 利用深度学习算法将高风险的切标词和词性进行标注 2,问题拓展(同义词、近义词拓展) 利用学习模型将目标问题,拓展为相近和类似问题组 3,标注任务管理(分组,任务分配,标注质量监控) 利用后台的管理功能,进行标注任务的分配和回收,标注质量的评价。 测试试用版地址:https...

2020-02-25 13:45:37 990

原创 [NLP] 免费中文文本多任务自动辅助标注工具

NLP领域的福利,错过这篇文章,你可能要在黑暗中摸索3,4年! 我们在NLP领域主要探索统一、自洽的多任务标注规范,从语义框架出发,将词性、实体识别、问答标注与自动扩充、事件抽取、三元组关系及知识图抽取、因果抽取等方向做深入探索。 针对通用语料的探索性标注,我们标注了《病理生理学》、《自然地理》等几本书,在标注过程中,我们发现尚无可以高效辅助标注的工具来降低标注门槛,提升标注效率。我们开始自己开发工具来满足日益复杂的标注规范。 在标注过程中,我们要解决的一系列问题是:如何保证我们能够及时发现现有标注模型(

2021-11-17 14:49:53 1186 3

原创 中文语料自动辅助标注的几个特点

文本标注虽然是信息处理最基本的要素,标注难度还是有一定的门槛。如何利用现有的技术加速标注过程,降低标注门槛是所有标注行业都在探索的问题。 BOTSALLY®赛莉®中文语料自动标注系统平台是本识在做信息挖掘时建立的自动辅助标注工具,会陆续开放更多的的功能模块邀请大家试用。 中文语料自动辅助标注系统不能完全替代人工标注,但能够提供很多有用的工具。 对比一下,具有下面几个特点: 1,较为先进的预标注模型...

2020-03-20 11:27:26 461

原创 [NLP] 中文文本自动辅助标注工具推荐

我们的项目需要用到文本挖掘和事件提取技术,没有现成的工具可以用,所以我们自己开发了一套小工具来为我们的事件图提供初级的中文标注语料。 经过我们的多次迭代逐渐趋于稳定,现在开放出部分功能来为大家提供服务。 目前开放和即将开放的功能有:细粒度分词和词性标注、实体识别与标注、问题智能扩充、事件提取与标注等等。 传送地址: https://www.botsally.tech ...

2020-03-16 10:45:15 1756

原创 BOTSALLY自动辅助标注系统-使用说明

BOTSALLY自动辅助标注系统是一个辅助标注工具,能有效降低标注人员的工作量,提升标注一致性和标注质量。 下面介绍一下使用方法: 1,平台地址 网址:www.botsally.tech 2,注册登录 依次填入登录名,密码,输入验证码,如果验证码过期,请点击验证码图片刷新。第一次登录建议点击立即注册,可以解锁更多功能。 3,中文文本细粒度切分标注自动辅助模块 登录后,点击左侧工具栏“增强功能”中的...

2020-03-12 17:51:29 461

原创 中文标准标注语料的标注中的几个问题

想让机器能够跟人一些样非常智能地处理自然语言,一直是我们的梦想。实现这个理想涉及到很多领域的技术,不管如何设计,自然语言处理(NLP)技术是必备的一环。 而自然语言处理中,想要训练一个好的模型,语料是绕不过去的门槛。没有语料,哪里来的模型?而且语料标注规则是否统一、自洽是训练自动处理模型的关键。不管项目大小,拥有相当规模的语料就成了关键。 语料从何而来?寻求供应商当然是最快最便捷的方法。然而供应商...

2020-03-12 17:41:20 2091

赛莉标准中文自动标注平台_精标语料5.zip

对于语料标注工程师来说,在确定大规模标注外包前,针对标注规范的确认需要慎之又慎。标注规范需要自洽,且颗粒度要适中,决定了语料和模型的识别效果的上限。赛莉中文语料自动标注平台可以提供一揽子解决方案,将标注效率提高5-8倍,准确率提升15个点。

2021-11-14

中文NLP+算法工程师语料标注工程师-赛莉标准中文自动标注平台_精标语料4.zip

语料标注工程师的工作要甚于算法工程师。除了构建算法自洽的标注规则外,还要让后续工作的标注员的标注门槛降低。自动标注工具可以1,提升标注效率;2,降低标注员的学习和标注门槛;3,维护标注规则。另外XML文件或者数据格式可以承载无线多的标注内容,推荐使用。

2021-11-14

中文语料- NLP工程师-赛莉标准中文自动标注平台_精标语料3.zip

XML格式的语料可以在开放平台找到转换工具,自动转换为其他格式的序列标注数据。自动标注数据-标注规范是统一的整体。如果没有一个自洽的,颗粒度一致的标注规范,大概率是很难有好的模型训练出来了。所以,针对任务的标注规范探索才是这个行业的基础和核心。

2021-11-14

中文语料-语料标注工程师算法工程师-赛莉标准中文自动标注平台_精标语料2.zip

无论是从事算法研究还是语料标注的工程师,需要有最基础的认知:一款可以为自己提效的工具。赛莉开放标注平台可以自动标注、自动查错、短语搜索等功能,基本可以事半功倍。语料是精标数据,符合国标,XML格式含有丰富的标注信息,可以i通过工具转换成其他形式的标注序列。

2021-11-14

赛莉标准中文标注平台_精标语料.zip

无论是知识图自动生成、事件抽取、还是实体识别等,都离不开精标的,复合统一和自洽的标注标准的语料。语料自动标注,一方面可以提升语料的标注速度(赛莉平台测试标注速度提升到5~8倍),另一方面可以自动遵循标注标准,减小标注风险。

2021-11-14

实体细切精标新闻_标签与标注方法展示.zip

赛莉®中文语料自动标注 做了大的更新和升级,后端处理切换到吞吐量更大的服务器,事件抽取和发现模块测试中,QA模块正在研发。资料内是平台自动标注+人工纠正的细切精标语料,可以作为训练数据来用。

2020-05-08

BOTSALLY® 赛莉®中文语料自动标注语料样例

赛莉®中文语料自动标注 https://www.botsally.tech 更多的语料资源,请到标注语料下载页面下载,语料的下载仅用于科研实验,商业应用请购买版权。

2020-04-28

BOTSALLY® 赛莉®中文语料自动标注-细切-词性标注语料样例

赛莉®中文语料自动标注 https://www.botsally.tech 更多的语料资源,请到标注语料下载页面下载,语料的下载仅用于科研实验,商业应用请购买版权。

2020-04-28

BOTSALLY® 赛莉®中文语料自动标注-实体识别标注_精细切分_样例

BOTSALLY® 赛莉®中文语料自动标注 最近更新了一些重要功能:更新版的系统使用说明书,标注语料下载页面更新,XML文件转换功能,词性标注实体版,实体标注,还有事件标注。语料的下载仅用于科研实验,商业应用请购买版权。

2020-04-28

事件标注标签展示样例1.xml.zip

BOTSALLY® 赛莉®中文语料自动标注 更新了几个新的功能模块,包含数据转换,事件标注等。标准事件8大类35小类,严格按照ACE2005的标准定义设计。更多语料请关注 赛莉中文语料自动标注平台。

2020-04-17

赛莉®中文语料自动标注_精细切分标注标签展示样例1_新闻

BOTSALLY® 赛莉®中文语料自动标注 精细切分标注标签展示样例1_新闻。在多个标注员协作标注同一个标注任务的需求下,标注的一致性仍然有保证的。可以降低标注员的学习门槛。快速扩充标注团队。测试阶段,每个管理账号可以拥有超过50个独立标注员子账号。

2020-04-08

实体识别标签展示样例2_新闻事件_赛莉®中文语料自动标注

BOTSALLY® 赛莉®中文语料自动标注 的实体和事件辅助自动标注系统将实体抽取并标记出来,实体的在事件内的标签是ACE2005的标准,实体在文档切分标注中的标签是GB/T20532-2006标准。全文保持细粒度切分,采用XML的数据格式保存切分数据和切分信息。

2020-04-07

happynewyear2019.xml.zip

自动切标的标签体系展示,可以作为切标的训练语料的一部分。赛莉自动标注系统可以自动完成大部分的工作,并对高风险的问题标注方法高亮,引导人工纠错工作。还有智能算法配合人工纠错,很大程度上提高了标注效率。BOTSALLY® 赛莉®中文语料自动标注 地址 https://www.botsally.tech

2020-03-31

实体识别数据样例.xml.zip

实体识别是数据挖掘的基本动作。如何能够快速的拥有一批覆盖广泛且能使训练模型更加灵敏高效的语料是必要条件。BOTSALLY® 赛莉®中文语料自动标注 www.botsally.tech 结合多年的探索经验,积累了一批语料,并拥有各种快速标注模型,让中文文本的标注门槛不断降低。上面是我们输出的实体识别语料样式。

2020-03-31

事件抽取标签展示样例1em.xml.zip

如何利用工具进行快速标注是所有人的愿望,赛莉自动标注系统可以自动完成大部分的工作,这是我们的事件抽取展示文档。我们做了标准语料 事件抽取标签展示 无版权 不做商业用途 ,更多语料,欢迎关注 https://www.botsally.tech BOTSALLY® 赛莉®中文语料自动标注系统 语料持续更新

2020-03-23

切分标注标签展示样例3_bg.xml.zip

如何利用工具进行快速标注是所有人的愿望,赛莉自动标注系统可以完成大部分的工作,这是我们的标签展示文档。我们做了标准语料 切分和标签展示 无版权 不做商业用途 ,更多语料,欢迎关注 https://www.botsally.tech BOTSALLY® 赛莉®中文语料自动标注系统 语料持续更新

2020-03-23

切分标注标签展示样例2_dna.xml.zip

中文信息挖掘的模型很多,标签的设计与模型性能直接相关,这是我们的标签展示文档。我们做了标准语料 切分和标签展示 无版权 不做商业用途 ,更多语料,欢迎关注 https://www.botsally.tech BOTSALLY® 赛莉®中文语料自动标注系统 语料持续更新

2020-03-23

切分标注标签展示样例1_.xml.zip

很多朋友需要标准语料来训练深度模型,语料到模型的过程中涉及很多方面的因素,需要综合考量。我们做了标准语料 切分和标签展示 无版权 不做商业用途。

2020-03-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除