![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
DragonBallSuper
Grandir dans l'apprentissage
展开
-
深度学习(DL) /人工智能(AI)数据集标注工具、图像语料数据库
一、NLP标注工具BRATBRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的标注结果能够把无结构化的原始文本结构化,供计算机处理。利用该工具可以方便的获得各项NLP任务需要的标注语料。以下是利用该工具进行命名实体识别任务的标注例子。 WeTest舆情团队在使用:http://wetest.qq.com/bee/ 使用案例:http://blog.csdn.net/...转载 2018-05-04 17:25:14 · 8322 阅读 · 0 评论 -
NLTK学习笔记(八):文法--词关系研究的工具
版权声明:更多原创文章请访问: http://yuanxin.me/ https://blog.csdn.net/AsuraDong/article/details/73502642 文法 自定义文法 文法用途 开发文法 分析文法的算法 递归下降解析器 移进-归约解析器 基于特征的文法 属性和约束 处理特征结构 包含和统一...转载 2018-08-28 17:20:13 · 332 阅读 · 0 评论 -
NLTK学习笔记(七):文本信息提取
版权声明:更多原创文章请访问: http://yuanxin.me/ https://blog.csdn.net/AsuraDong/article/details/73477666 实体识别分块技术 分块语法的构建 树状图 IOB标记 开发和评估分块器 命名实体识别和信息提取 如何构建一个系统,用于从非结构化的文本中提取结构化的信息和数据?...转载 2018-08-28 17:17:41 · 1457 阅读 · 0 评论 -
NLTK学习笔记(六)机器学习:利用NLTK进行简单文本分析
版权声明:更多原创文章请访问: http://yuanxin.me/ https://blog.csdn.net/AsuraDong/article/details/73302999关于分类文本,有三个问题 1. 怎么识别出文本中用于明显分类的特征 2. 怎么构建自动分类文本的模型 3. 相关的语言知识按照这个思路,进行了艰苦学习(手动捂脸)。一、监督式分类:建立...转载 2018-08-28 17:13:15 · 856 阅读 · 0 评论 -
NLTK学习笔记(四)自然语言处理的一些算法研究和实现(NLTK)
版权声明:更多原创文章请访问: http://yuanxin.me/ https://blog.csdn.net/AsuraDong/article/details/73136439自然语言处理中算法设计有两大部分:分而治之 和 转化 思想。一个是将大问题简化为小问题,另一个是将问题抽象化,向向已知转化。前者的例子:归并排序;后者的例子:判断相邻元素是否相同(与排序)。这次总结的自然语言中...转载 2018-08-28 17:10:35 · 504 阅读 · 0 评论 -
NLTK学习笔记(五):分类和标注词汇
版权声明:更多原创文章请访问: http://yuanxin.me/ https://blog.csdn.net/AsuraDong/article/details/73149582词性标注器之后的很多工作都需要标注完的词汇。nltk自带英文标注器pos_tagimport nltktext = nltk.word_tokenize("And now for something...转载 2018-08-28 17:06:26 · 678 阅读 · 0 评论 -
NLTK学习笔记(三):NLTK的一些工具
主要总结一下简单的工具:条件频率分布、正则表达式、词干提取器和归并器。条件分布频率《自然语言学习》很多地方都用到了条件分布频率,nltk提供了两种常用的接口:FreqDist 和 ConditionalFreqDist 。后面很多都会用到这两种方法,特别是第二个。因为第二个更符合定义,会智能的找到条件。 然后根据绘图的库,可以做出来很漂亮的图形。简单的FreqDist函数...转载 2018-08-28 16:58:16 · 444 阅读 · 0 评论 -
NLTK学习笔记(二):文本、语料资源和WordNet汇总
语料库基本函数表示例 描述 fileids() 语料库中的文件 fileids([categories]) 对应分类中的语料库文件 categories() 语料库的分类 categories([fileids]) 文件对应的语料库分类 raw(fileids=[f1,f2..],categories=[c1,c2…]) 对应文件和分类中...转载 2018-08-28 16:47:50 · 488 阅读 · 0 评论 -
nowcoder刷题总结
1、基本型和基本型封装型进行“==”运算符的比较,基本型封装型将会自动拆箱变为基本型后再进行比较,因此Integer(0)会自动拆箱为int类型再进行比较,显然返回true;2、两个Integer类型进行“==”比较,如果其值在-128至127,那么返回true,否则返回false, 这跟Integer.valueOf()的缓冲对象有关,这里不进行赘述。3、两个基本型的封装型进行equals(...原创 2018-09-19 15:46:02 · 6034 阅读 · 0 评论