文本挖掘
宏飞英翔
乐于分享学习NLP。QQ:2513895055
展开
-
文本特征提取方法研究
一、课题背景概述 文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结转载 2016-04-29 09:45:52 · 1311 阅读 · 0 评论 -
windows下安装gensim
电脑中要先安装pip工具,安装方法:http://blog.csdn.net/u011806486/article/details/51758218 安装pip之后,将下载的whl文件移动到python安装目录下的Scripts目录; cmd进入python安装目录下的Scripts目录 执行: pip install numpy*.whl pip install s原创 2017-03-07 09:37:08 · 909 阅读 · 0 评论