数据分析
子衿_青青
不闻不若闻之,闻之不若见之,见之不若知之,知之不若行之
展开
-
Anaconda spyder下载第三方包
1)spyder界面点击Tools -> Open command prompt 即可进入cmd界面 2)在cmd界面输入 pip install 包名例如,我就输入了pip install keras,然后等待,结果如下(只截图了一部分)原创 2017-01-06 09:53:40 · 14024 阅读 · 0 评论 -
python数组的.argsort()
python数组的.argsort(),返回从小到大排序后,原位置所对应的索引,而数组并没有排序import numpy as npfrom numpy import *distances = array([2,1,7,6,9])sortindex = distances.argsort()print(sortindex)#返回的是索引(数组的下标)print(distances)#原创 2017-01-25 17:45:05 · 1036 阅读 · 0 评论 -
python numpy中数组.min()
import numpy as npa = np.array([[1,5,3],[4,2,6]])print(a.min()) #无参,所有中的最小值print(a.min(0)) # axis=0; 每列的最小值print(a.min(1)) # axis=1;每行的最小值结果:1[1 2 3][1 2]原创 2017-01-26 09:53:55 · 51357 阅读 · 1 评论 -
python字符串操作
转载自:http://www.cnblogs.com/saneri/p/5784087.html,如侵权请告知删除python的字符串属性函数1.字符串属性方法操作:1.>字符串格式输出对齐1234567891011>>> str = "P转载 2017-02-22 20:15:31 · 334 阅读 · 0 评论 -
dictionary changed size during iteration
python 3.x在机器学习实战中, for k in headerTable.keys():#移除不满足最小支持度的元素项 if headerTable[k] del(headerTable[k])出现dictionary changed size during iteration原因是:python3.x中,headerTab原创 2017-02-14 16:33:40 · 1482 阅读 · 0 评论 -
read_csv 日期不是时间序列
比如说我的csv中有一列是时间:1949-01-01,当我直接read_csv(fileName)时,得到的数据,它的时间这一列被当做 object(或者string),导致进行时间序列预测的时候,不好操作,也不好画图,那怎么转换呢以下转自:stackoverflow1)单列转换dateparse = lambda x: pd.datetime.strptime(x, '%转载 2017-02-23 08:56:11 · 9591 阅读 · 0 评论 -
Python shift()
转自:https://sanwen8.cn/p/2241oUa.html eg: x_diff = x - x.shift() #一阶差分shift函数是对数据进行移动的操作,假如现在有一个DataFrame数据df,如下所示:indexvalue1A0B1C2转载 2017-02-23 10:01:59 · 45843 阅读 · 2 评论 -
TypeError: 'dict_keys' object does not support indexing
a = {0:'左左',1:'右右'}k = a.keys()print(k[0])会产生错误:TypeError: 'dict_keys' object does not support indexing这是由于python3改变了dict.keys,返回的是dict_keys对象,支持iterable 但不支持indexable,我们可以将其明确的转化成list:a = {原创 2017-01-30 10:40:05 · 8948 阅读 · 1 评论 -
'range' object doesn't support item deletion
del(trainingSet[randIndex])python3.x , 出现错误 'range' object doesn't support item deletion原因:python3.x range返回的是range对象,不返回数组对象解决方法:把 trainingSet = range(50) 改为 trainingSet = list(range(50))原创 2017-02-02 13:42:58 · 22191 阅读 · 10 评论 -
anaconda安装feedpars
进入spyder,点击Tools -> Open command prompt,进入命令行界面,输入 pip install feedparser等待即可。。。结果如下原创 2017-02-02 14:05:21 · 1105 阅读 · 0 评论 -
wei.getA()
机器学习实战中,出现一个wei.getA(),在贴吧中发现了正解:matrix.getA()Return self as an ndarray object.Equivalent to np.asarray(self).Parameters: None Returns: ret : ndarrayself as an ndarray 也就是说矩阵通过这个getA()这个方法转载 2017-02-02 22:25:03 · 826 阅读 · 0 评论 -
operands could not be broadcast together with shapes
今天在对着http://cs231n.github.io/python-numpy-tutorial练习matplotlib显示图片的时候, img_tinted = img * [1, 0.95, 0.9] 这条语句就出错了,ValueError: operands could not be broadcast together with shapes (200,200,4)原创 2017-02-24 10:44:41 · 144596 阅读 · 3 评论 -
python print 按逗号或空格分隔
1)按,分隔 a, b = 0, 1while b < 1000: print(b, end=',') a, b = b, a+b1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,2)按空格分隔a, b = 0, 1while b < 1000: print(b, end=' ') a, b =原创 2017-01-08 22:42:12 · 23405 阅读 · 0 评论 -
mnist.pkl.gz UnicodeDecodeError
代码如下(python3 pickle取代了cPickle):import pickle, gzip, numpyf = gzip.open('mnist.pkl.gz','rb')train_set, valid_set, test_seet = pickle.load(f)f.close()结果出错了: train_set, valid_set, test_seet = pick原创 2017-03-06 08:48:49 · 3033 阅读 · 0 评论 -
python3的编码问题
转自:http://blog.sina.com.cn/s/blog_6d7cf9e50102vo90.html转眼我们就在‘下期’见面啦。学习笔记的文章搁置了那么久,现在回来继续,这次谈谈Python3中的编码问题。介绍Python3中的编码问题前,第一个段落对字节、ASCII与Unicode与UTF-8等进行基本介绍,如果不对这几种编码犯头晕,可直接跳过。ASCII与Uni转载 2017-03-06 09:01:21 · 632 阅读 · 0 评论 -
matlab candle横坐标日期显示不对
在matlab中,用金融工具箱中的candle函数来画K线,可是横坐标却显示一些奇怪的东西,那怎么办呢?加个日期格式就好了先来看看candle的解释:在matlab中输入 doc candle,回车即可看到解释(我的matlab版本是R2014a)关键就在这个Dateform这里了,首先你的Dates是不是datenum格式(7.32443e+5这种)?是的话,只需要加Date原创 2017-03-19 15:38:18 · 3362 阅读 · 0 评论 -
Matlab用三种格式来表示日期与时间
Matlab用三种格式来表示日期与时间转自http://www.360doc.com/content/14/1206/16/16363452_430844776.shtml(1)双精度型日期数字:一个日期型数字代表从公元0年到某一日期的的天数,例如,2008年8月26日夜时0点钟被表示为733646,而这同一天的中午12点就被表示为733646.5,也就是说任何一个时刻都可以用一个双精度型转载 2017-03-19 15:39:34 · 23826 阅读 · 0 评论 -
matlab设置断点无效
转载自 点击打开链接1) 路径中存在中文字符,以致于断点无效2) 在程序中有 clear all,会把断点信息也清除掉,去掉all就好了转载 2017-03-25 15:53:09 · 9833 阅读 · 0 评论 -
python中sum函数
版本:python3 python自带的sum函数(或者Numpy中的sum函数),无参时,所有全加;axis=0,按列相加;axis=1,按行相加import numpy as np#python中自带的sumprint(sum([[1,2,3],[4,5,5]]))print(sum([[1,2,3],[4,5,5]],axis=0))print(sum([[1,2,3],[4原创 2017-01-25 17:13:50 · 9370 阅读 · 0 评论 -
python random随机数
转自:点击打开链接Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。random.randomrandom.random()用于生成一个0到1的随机符点数: 0 random.uniform random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随机符点转载 2017-02-21 17:05:57 · 325 阅读 · 0 评论 -
anaconda libsvm安装32位或64位
1)进入spyder,点击Tools -> Open command prompt,进入命令行界面,输入 pip list 查看有没有wheel(一般adaconda自带这个,可以忽略这步), 没有的话 输入pip install wheel安装2)到 http://www.lfd.uci.edu/~gohlke/pythonlibs/#libsvm,找到对应的进行下载原创 2017-01-06 20:16:19 · 3770 阅读 · 0 评论 -
python 中 sorted() 和 list.sort() 的用法
转载自 http://www.cnblogs.com/freemao/p/3869994.html今天用python自带的sorted对一个列表进行排序,在这里总结一下 只要是可迭代对象都可以用sorted 。 sorted(itrearble, cmp=None, key=None,reverse=False) =号后面是默认值 默认是升序排序的, 如果想转载 2017-01-09 19:12:35 · 4986 阅读 · 0 评论 -
python lambda
1)lambda函数lambda语句中,冒号前是参数,可以有多个,用逗号隔开,冒号右边的返回值。lambda语句构建的其实是一个函数对象t = lambda x,y: x+yprint(t(1,2)) #输出32)无参lambdat = lambda: 'string'print(t()) #输出 string3)有参lambda 3.1 不带默认值的lambda原创 2017-01-09 19:30:13 · 350 阅读 · 0 评论 -
numpy中multiply函数怎么用
multiply(a,b)就是个乘法,如果a,b是两个数组,那么对应元素相乘numpy.multiplynumpy.multiply(x1, x2[, out]) = Multiply arguments element-wise.Parameters:x1, x2 : array_likeInput arrays to be multiplied.Returns:y : ndarrayT原创 2017-02-05 00:01:48 · 41115 阅读 · 1 评论 -
python函数式编程 map、reduce、filter
1) map函数 a = [1, 2, 3]b = map(lambda x: x+2, a)b = list(b)print(b) #[3, 4, 5]在python 3.x中,map函数仅仅是创建一个待运行的命令容器,只有其他函数调用它的时候才返回结果,所以需要b=list(b) map(lambda x, y : x*y, a,b)表示将a,b两个列表的元素对应想乘,把结果返回原创 2017-01-09 21:42:57 · 379 阅读 · 0 评论 -
Numpy的ndarray
1)ndarray是N维数组对象,其中所有的元素必须是相同类型,可以对整块数据进行一些数学运算 import numpy as npa = [1, 2, 3]b = 3*ac = np.array(a)*3print(b)print(c)print(c+c)[1, 2, 3, 1, 2, 3, 1, 2, 3][3 6 9][ 6 12 18]原创 2017-01-09 23:43:27 · 607 阅读 · 0 评论 -
numpy.tile()
numpy.tile()是个什么函数呢,说白了,就是把数组沿各个方向复制比如 a = np.array([0,1,2]), np.tile(a,(2,1))就是把a先沿x轴(就这样称呼吧)复制1倍,即没有复制,仍然是 [0,1,2]。 再把结果沿y方向复制2倍,即最终得到 array([[0,1,2], [0,1,2]])同理:>>> b =原创 2017-02-06 21:50:19 · 96552 阅读 · 4 评论 -
机器学习实战 KNN算法
# -*- coding: utf-8 -*-"""Created on Wed Jan 25 13:45:32 2017@author: Administrator"""#KNN,K-近邻算法from numpy import *import operator #运算符模块#建样本集def createDataSet(): group = array([[1.0,原创 2017-01-25 18:21:36 · 408 阅读 · 0 评论 -
numpy flatten
a是个矩阵或者数组,a.flatten()就是把a降到一维,默认是按横的方向降>>> a = np.array([[1,2], [3,4]])>>> a.flatten()array([1, 2, 3, 4])>>> a.flatten('F') #按竖的方向降array([1, 3, 2, 4])那么a.flatten().A又是什么呢? 其实这是因为此时的a是个矩阵,降维后原创 2017-02-07 21:59:36 · 15523 阅读 · 0 评论 -
numpy nonzero
numpy.nonzero(a): 返回的是a中非0元素的索引的元组,经常可以用a[nonzero(a)]得到a中非0元素>>> x = np.eye(3)>>> xarray([[ 1., 0., 0.], [ 0., 1., 0.], [ 0., 0., 1.]])>>> np.nonzero(x)(array([0, 1, 2]), a原创 2017-02-08 12:54:43 · 665 阅读 · 0 评论 -
python list
一、空的list s = [] 或者 s = list()二、list能索引和切片,能根据索引和切片直接修改原来的值 squares=[1,4,9,16,25] >>> squares[0] # indexing returns the item1>>> squares[-1]25>>> squares[-3原创 2017-01-08 22:01:49 · 291 阅读 · 0 评论 -
python string
一、封闭在单引号或双引号里 print('spam eggs')print('doesn\'t')# use \' to escape the single quote print("doesn't")# ...or use double quotes insteadprint('"Yes," he said.')print( "\"Yes,\" he said.")print('"原创 2017-01-08 22:49:34 · 515 阅读 · 0 评论 -
python 控制语句
一、 ifif x < 0: x = 0 print('Negative changed to zero')elif x == 0: print('Zero') print('Single')else: print('More')二、forwords = ['cat', 'window', 'defenestrate']for w in w原创 2017-01-09 18:04:15 · 1022 阅读 · 0 评论 -
numpy数组切片与索引
转自:http://cs231n.github.io/python-numpy-tutorial/#python-containers一、 如何切片和索引:import numpy as np# Create the following rank 2 array with shape (3, 4)# [[ 1 2 3 4]# [ 5 6 7 8]# [ 9 1转载 2017-02-19 16:52:30 · 18122 阅读 · 1 评论 -
No module named 'Tkinter'
python 3.x 输入 from Tkinter import * 结果出错:No module named 'Tkinter'而Tkinter是python内置的模块,不可能不在,于是Tkinter改成首字母小写就好了,即 from tkinter import *原创 2017-02-12 11:15:21 · 1737 阅读 · 0 评论 -
numpy tolist()
将数组或者矩阵转换成列表,如下:>>> from numpy import *>>> a1 = [[1,2,3],[4,5,6]] #列表>>> a2 = array(a1) #数组>>> a2array([[1, 2, 3], [4, 5, 6]])>>> a3 = mat(a1) #矩阵>>> a3matrix([[1, 2, 3],原创 2017-02-13 10:08:20 · 26190 阅读 · 2 评论 -
python zip
zip接受多个序列对象作为参数,返回一个tuple的序列,细节如下:zip(*iterables)Make an iterator that aggregates elements from each of the iterables.Returns an iterator of tuples, where the i-th tuple contains the i-th原创 2017-02-21 16:04:28 · 2004 阅读 · 0 评论 -
pd.pivot_table的作用
给了例子来解释吧>>> df A B C D0 foo one small 11 foo one large 22 foo one large 23 foo two small 34 foo two small 35 bar one large 46 bar one small 57 bar two small 68原创 2017-04-22 10:38:09 · 1885 阅读 · 0 评论