文本挖掘
搬砖小工053
这个作者很懒,什么都没留下…
展开
-
[生物医学文本挖掘]利用文本特征用于提取文献中药物之间的关系
生物医学文本挖掘—文献阅读汇报笔记(1)今年三月份准备投个会议文章,参考了一篇生物医学文本挖掘(BioNLP) 的文章文章链接,非教育网的朋友请点击百度云查看。这篇文章在之前实验室的journal club 论文交流的时候讲过,这里把ppt贴上,ppt总结了文章的主要内容,欢迎大家批评指正。第一页:文章标题姓名信息啥的删了 #(^_^)#第二页:文章基本信息发表不到一年,引用29次,文章还可以,但原创 2015-05-12 11:11:01 · 3119 阅读 · 3 评论 -
【1】文本挖掘的主要概念
转自 NLP论坛 http://www.threedweb.cn/thread-1281-1-1.html什么是文本挖掘文本挖掘可以广义地定义知识密集的处理过程,其中用户使用一套分析工具与文档集合动态(随着时间的推移)交互。在类似于数据挖掘的方式,文本挖掘旨在通过识别令人感兴趣的模式来提取和搜索数据源中有用信息。在文本挖掘中,数据来源是文档集合,发现令人感兴趣的模式不是来自形式化的数据库记录,而是非转载 2016-08-01 08:56:44 · 3674 阅读 · 0 评论 -
【2】广义向量空间模型
转自 NLP论坛 http://www.threedweb.cn/thread-1283-1-1.html文本最流行的结构化表示就是向量空间模型,它把文本表示为一个向量,其中该向量的每个元素表示为文本中出现的单词。这会导致极高维的空间;通常,文本文档的集合中出现的每一个不同的字符串都是一个维度,包括常用英语词和其他类型字符串,如电子邮件地址和URL。对于合理大小的文本文件集合,向量很容易就包含数十万转载 2016-08-01 09:22:01 · 1320 阅读 · 0 评论 -
【3】 文本挖掘方法论
转自 NLP论坛 http://www.threedweb.cn/thread-1284-1-1.html http://www.threedweb.cn/thread-1285-1-1.html http://www.threedweb.cn/thread-1286-1-1.html文本挖掘流程第1阶段:确定研究目的像任何其他项目一样,文本挖掘的研究开始于研究目的的决策。这需要深入了解业务情况转载 2016-08-01 10:06:19 · 2547 阅读 · 0 评论 -
【4】构建基于scikit-learn的文本挖掘学习系统
转自 NLP论坛 http://www.threedweb.cn/thread-1293-1-1.html配置开发环境构建基于scikit-learn的文本挖掘学习系统1. 下载和安装 python-2.7.8 for win322. 下载和安装 numpy-1.9.0-win32-superpack-python2.73. 下载和安装 scipy-0.14.0-win32-superpack-转载 2016-08-01 10:14:12 · 1403 阅读 · 0 评论 -
【5】使用结巴分词对分类语料库分词
转自 NLP论坛 http://www.threedweb.cn/thread-1295-1-1.html 工作空间(workspace)路径:X:\WorkSpace\text_mining X为Windows硬盘盘符 项目主目录:text_mining |-- text_corpus_small 目录:未分词训练语料库路径,子目录名称为语料库的分类,该类所属文本就位于子目录中转载 2016-08-01 10:19:31 · 4945 阅读 · 0 评论