python
文章平均质量分 68
大雄没有叮当猫
好好学习,天天向上
展开
-
python自然语言处理库之gensim简介
微信公众号:数据挖掘与分析学习Gensim是一个免费的 Python库,旨在从文档中自动提取语义主题,尽可能高效(计算机方面)和无痛(人性化)。Gensim旨在处理原始的非结构化数字文本(“ 纯文本 ”)。在Gensim的算法,比如Word2Vec,FastText,潜在语义分析(LSI,LSA,见LsiModel),隐含狄利克雷分布(LDA,见LdaModel)等,自动训练文档的躯体...原创 2018-09-18 10:41:48 · 1519 阅读 · 0 评论 -
gensim学习之语料库和向量空间
微信公众号:数据挖掘与分析学习1.字符串转为向量1.1导入所需库 import logging logging.basicConfig(format='%(asctime)s:%(levelname)s:%(message)s',level=logging.INFO) from gensim import corpora from ...原创 2018-09-18 10:44:24 · 1766 阅读 · 0 评论 -
Python 迭代器 & __iter__方法
迭代器就是重复地做一些事情,可以简单的理解为循环,在python中实现了__iter__方法的对象是可迭代的,实现了next()方法的对象是迭代器,这样说起来有点拗口,实际上要想让一个迭代器工作,至少要实现__iter__方法和next方法。很多时候使用迭代器完成的工作使用列表也可以完成,但是如果有很多值列表就会占用太多的内存,而且使用迭代器也让我们的程序更加通用、优雅、pythonic。如果...转载 2018-09-18 16:51:10 · 1370 阅读 · 0 评论 -
python机器学习之10分钟掌握pandas
微信公众号:数据挖掘与分析学习1.创建对象通过传递值列表来创建Series,让pandas创建一个默认的整数索引:通过传递带有日期时间索引和标记列的NumPy数组来创建DataFrame:通过传递可以转换为类似series的对象的dict来创建DataFrame。生成的DataFrame的列具有不同的dtypes。 2.查看数据以下是查看frame的...原创 2018-09-18 16:56:15 · 500 阅读 · 0 评论 -
Python 中pandas读取文件报错:Initializing from file failed
Pandas读取文件报如下错误:---------------------------------------------------------------------------OSError Traceback (most recent call last)<ipython-input-3-d6365c70e...原创 2018-09-11 09:55:12 · 1792 阅读 · 1 评论 -
机器学习之Numpy基本用法(一)
微信公众号:数据挖掘与分析学习1.基础NumPy的主要对象是同构的多维数组。它是一个元素表(通常是数字),都是相同的类型,由正整数元组索引。在NumPy维度中称为轴。轴数是等级。例如,3D空间[1,2,1]中的点的坐标是等级1的数组,因为它具有一个轴。该轴的长度为3.在下图所示的示例中,数组具有等级2(它是2维的)。第一维(轴)的长度为2,第二维的长度为3。[[ 1., 0., 0...原创 2018-09-15 10:38:39 · 3751 阅读 · 0 评论 -
机器学习之Numpy基本用法(二)
微信公众号:数据挖掘与分析学习1.复制和视图在操作数组时,有时会将数据复制到新数组中,有时则不会。 这通常是初学者混淆的根源。 有三种情况:1.1 不复制简单的赋值不会复制数组对象或其数据。Python将可变对象作为引用传递,因此函数调用不会复制。1.2 视图或浅拷贝不同的数组对象可以共享相同的数据。 view方法创建一个查看相同数据的新数组对象。对数组...原创 2018-09-15 10:40:12 · 352 阅读 · 1 评论 -
Python 类特殊方法之__getitem__
凡是在类中定义了这个__getitem__ 方法,那么它的实例对象(假定为p),可以像这样p[key] 取值,当实例对象做p[key] 运算时,会调用类中的方法__getitem__。一般如果想使用索引访问元素时,就可以在类中定义这个方法(__getitem__(self, key) )。先用一个夸张一点的例子来说明这个问题。class DataBase: def __i...原创 2019-03-13 21:05:34 · 4346 阅读 · 1 评论