自然语言处理
fpzRobert
优秀不够,你是否无可替代。
展开
-
【中文文本分类实战系列】朴素贝叶斯实现THUCNews文本分类
中文文本分类实战持续更新THUCNews数据集数据集下载THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。我们在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。数据预处理特征工程模型训练模型...原创 2020-06-06 08:47:06 · 4007 阅读 · 5 评论 -
关键词提取算法概述
关键词提取概述概念关键词是指能反映文本主题或者主要内容的词语。关键词提取是NLP领域的一个重要的子任务。在信息检索中,准确的关键词提取可以大幅提升效率;在对话系统中,机器可以通过关键词来理解用户意图;在自动文摘、文本分类中,关键词的发现也非常有帮助。关键词提取方法概述关于文本的关键词提取方法分为:有监督的关键词抽取算法半监督的关键词抽取算法无监督的关键词抽取算法有监督的关键词抽...原创 2019-01-22 09:23:10 · 5002 阅读 · 0 评论 -
数据挖掘、机器学习、自然语言处理Python工具包(持续更新)
数据挖掘、机器学习、自然语言处理Python工具包(持续更新)科学计算Python包NumpyNumpy中文学习文档Numpy官方文档Numpy是一个功能强大的Python库,主要用于对多维数组执行计算。Numpy这个词来源于两个单词-- Numerical和Python。Numpy提供了大量的库函数和操作,可以帮助程序员轻松地进行数值计算。这类数值计算广泛用于以下任务:机器...原创 2019-03-22 18:20:21 · 591 阅读 · 0 评论 -
【命名实体识别(NER)】(1):命名实体识别综述
命名实体识别综述什么是命名实体识别?命名实体识别(Named Entity Recognition,简称NER),又称作**“专名识别”,是自然语言处理中的一项基础任务,应用范围非常广泛。命名实体一般指的是文本中具有特定意义或者指代性强的实体**,通常包括人名、地名、机构名、日期时间、专有名词等。通常包括两部分:实体的边界识别确定实体的类型(人名、地名、机构名或其他)NER系统就是从...原创 2019-03-23 09:41:44 · 31682 阅读 · 7 评论