自然语言处理
Seal_Wings
日常问题解决方法整理。
展开
-
实体识别模型演变与相关论文汇总
模型演变与相关论文汇总说明论文关键信息提取:作者想研究什么(introduction);采用了什么方法或方案(Results and Discussion);最后得出了什么结论。(最后再看实验方案。)基础《统计自然语言处理》命名实体识别部分基于规则⬇大规模语料库的统计方法条件随机场相关论文:基于条件随机场的命名实体识别研究_郭家清基于条件随机场的中文命名实体识别_向晓雯基...原创 2020-04-07 21:17:19 · 291 阅读 · 0 评论 -
社保领域知识图谱构建练手小实验(3)——社保领域概念提取算法
emmmm,直接照着文章中的实验部分做的。首先通过词性搭配规则获得候选概念jieba分词与词性标注对每种组成结构的概念进行统计(n-gram算法)原创 2020-04-06 10:06:21 · 282 阅读 · 0 评论 -
社保领域知识图谱构建练手小实验(2)——社保领域概念提取算法的训练语料准备
社保领域概念提取框架分词和词性标注是后续实体识别、关系抽取等步骤的关键基础。论文复现仍然主要依据《社保领域知识图谱构建及应用研究_李佳恒》。“社保领域概念大多数为一些由基本概念的组合而来的长词,而这些词一般是不会出现在分词工具的词典中,这种词被称作未登录词。解决这种问题有两种主流方法,一种是基于有监督机器学习的领域概念提取算法。这种方法需要人工对数据进行标注,利用隐马尔科夫和条件随机场等模型...原创 2020-04-02 22:25:49 · 590 阅读 · 0 评论 -
社保领域知识图谱构建练手小实验(1)——数据预处理
练手数据使用先前做文献计量学相关实验时为CiteSpace所下载的结构化的数据,原始数据为纯文本。(原始数据可以通过下面的链接自取)链接:https://pan.baidu.com/s/1IzP5VLAlz3h82kD0BZXU5Q提取码:ywbx复制这段内容后打开百度网盘手机App,操作更方便哦数据预处理1、用Python编程提取出其中的摘要部分。"""抽取出download_...原创 2020-03-24 22:09:17 · 760 阅读 · 0 评论 -
《Python机器学习基础教程》(二)——处理文本数据(交叉验证、网格搜索)
第7章 处理文本数据1.1思维导图1.2代码参考链接:1.3涉及到的算法原创 2019-11-06 20:26:24 · 670 阅读 · 0 评论 -
python文本挖掘(二)——实例1(TF-IDF算法)
分析小说《玩偶之家》参考链接:文本可视化[一]——《今生今世》词云生成与小说分析原创 2019-10-30 09:29:29 · 5940 阅读 · 0 评论 -
Python文本相似度分析(tf-idf)
。。。原创 2019-11-05 11:25:21 · 1993 阅读 · 0 评论 -
词汇处理——词义辨析消歧(一)
经典方法详细介绍解决NLP词义辨析消歧的经典方法研究现状对NLP词义辨析消歧的综述介绍原创 2019-11-04 12:12:58 · 4588 阅读 · 0 评论 -
python文本挖掘(一)
标题原创 2019-10-28 19:45:15 · 1696 阅读 · 0 评论