Python笔记
Tyrion49
学生
展开
-
python读写文件
打开文件open(file, mode=‘r’, buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)file: 文件路径(相对或者绝对路径)。mode: 文件打开模式,r表示是文本文件,rb是二进制文件(默认值就是r)buffering: 设置缓冲encoding: 一般使用...原创 2019-03-14 11:33:16 · 240 阅读 · 0 评论 -
jieba分词
jieba分词和关键词提取为处理团队从网站爬取的信息,尝试使用Python的jieba库进行关键字提取jieba分词1.jieba.cut():返回一个迭代器全模式: jieba.cut(string,cut_all=all)精确模式: jieba.cut(string, cut_all=false)默认是精确模式: jieba.cut(string)搜索引擎模式: jieba....原创 2019-03-11 20:00:57 · 329 阅读 · 0 评论 -
使用jieba进行关键字词提取(基于TF-IDF)
基于TF-IDF的关键词提取TF-IDF:Term frequency–inverse document frequencyTF-IDF方法通过计算单文本词频(Term Frequency, TF)和逆文本频率指数(Inverse Document Frequency, IDF)得到词语权重,按照权重排序,输出关键字原理:TF:如果某个单词在这段文字中出现频率越高,TF越大,说明这个单词对...原创 2019-03-11 20:52:44 · 4204 阅读 · 3 评论 -
使用jieba进行关键字词提取(基于Textrank算法)
基于Textrank的关键词提取函数:jieba.analyse.textrank(string, topK=20, withWeight=True, allowPOS=())string:待处理语句topK:关键字的个数,默认20withWeight:是否返回权重值,默认falseallowPOS:是否仅返回指定类型,默认为空import jieba.analysesentenc...转载 2019-03-12 10:23:43 · 8671 阅读 · 1 评论