- 博客(10)
- 资源 (2)
- 收藏
- 关注
原创 【python技能】词频统计
import jiebafrom astropy.table.np_utils import joinimport osimport sysimport jieba.posseg as psegdef main(): #分词结果存储列表 word_list = [] #词频统计词典{关键词:次数} word_dict = {} curren
2017-07-30 14:18:29 1055 1
原创 【python技巧实用篇】python读写文件、jieba自定义字典
本篇文章的主旨已经在注释注明,改代码经过测试,可以直接使用,any question,tell me
2017-07-29 21:57:38 6723
原创 【mark】pycharm及jieba安装说明
IDE: 建议到anaconda上安装pycharm。 window下安装jieba,需要在命令行模式下(windows+R),输入:cmd 然后 pip install jieba pip install gensim
2017-07-28 21:16:00 7813 2
原创 【技能篇】python读取文件、实体抽取
最近写了一个实体抽取,并且相应的实体填充预处理方案,代码如下(初步实现方案,后期会持续优化代码),完成所有功能会上传至Github上。import osimport gensimdef main(): word_list = ['平安银行', '000002', '测试', '买入'] #填充实体列表 entity_list = ['entity1
2017-07-28 21:07:27 3514 2
原创 机器学习常用的Python库
基于 Python 和 Scikit-Learn 的机器学习介绍:http://python.jobbole.com/81721/图解机器学习:神经网络和 TensorFlow 的文本分类:http://python.jobbole.com/88041/Python常用库1) numpy 2)scipy 3)matplot
2017-07-19 16:03:01 839
转载 【神经网络概述】
分享链接斯坦福大学公开课:http://open.163.com/special/opencourse/machinelearning.html深度学习教程:http://deeplearning.net/tutorial/知乎专栏:无痛的机器学习====================================================================
2017-07-18 14:45:20 444
转载 基于VSM计算相似度(含Python代码)
【本文核心来源于:http://www.cnblogs.com/eastmount/p/5055913.html】计算相似度的基本思想:1、分别统计两个文档的关键词;2、两篇文章的关键词合并成一个集合,相同的合并,不同的添加3、计算每篇文章对这个集合的词的词频,TF-IDF计算其权重4、生成两篇文章各自的词频向量5、计算两个向量的余弦相似度,值越小越相似详细代码见上述链
2017-07-17 15:15:38 2050
转载 中文分词
[本文核心源于:http://www.cnblogs.com/eastmount/p/5055906.html]比较常用的中文分词工具有中科院的分词工具ICTCLAS;jiaba是Python编程重用的分词包,主要包括分词、词性标注、关键词抽取等。jiaba教程:1.安装及入门介绍 参考地址:http://www.oschina.net/p/jieba
2017-07-17 14:39:07 416
转载 [情感分析的新方法]
转载自:http://datartisan.com/article/detail/48.html 情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中。通过这种方式,情感分析可以被视为利用一些情感得分指标来量化定性数据的方法。尽管情绪在很大程度上是主观的,但是情感量化分析已经有很多有用的实践,比如企业分析消费者对产品的反馈信息,或者检测
2017-07-17 11:37:41 679
转载 【我爱NLP汇总】
国内对自然语言处理比较系统的介绍要数“我爱自然语言处理”系列文章,接下来,打算花一段时间进行全面的了解一下(顺序从下->上)斯坦福大学深度学习与自然语言处理第三讲:高级的词向量表示斯坦福大学深度学习与自然语言处理第二讲:词向量斯坦福大学深度学习与自然语言处理第一讲:引言用MeCab打造一套实用的中文分词系统(三):MeCab-Chinese用Me
2017-07-16 15:24:27 3314
LSTM实例,可以运行
2017-09-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人