python数据分析基础
Heisenberg_888
互联网工程师,努力学习中
展开
-
numpy的random总结
rand随机样本位于[0, 1)中,均匀分布。import numpy as nparr1=np.random.rand(4,6)print(arr1)[[0.46510915 0.15711005 0.50389621 0.70637485 0.73428197 0.89304351] [0.73804292 0.21668988 0.3931718 0.59849005 0...原创 2019-12-05 10:50:17 · 353 阅读 · 0 评论 -
数据分析之小费数据集
import numpy as npfrom pandas import Series,DataFrameimport pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as snstips=sns.load_dataset('tips')print(tips.i...原创 2019-11-29 10:14:11 · 2130 阅读 · 0 评论 -
pandas可视化
线形图import numpy as npfrom pandas import Series,DataFrameimport pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt s=Series(np.random.normal(size=10))print(s)s.plot()plt.s...原创 2019-11-28 16:51:42 · 202 阅读 · 0 评论 -
pandas索引操作
索引对象是无法进行修改的,但是可以对索引重新排序,如果某个索引值不存在的话,就会引入缺失值。from pandas import Series,DataFrameimport pandas as pdimport numpy as npobj=Series([1,-2,3,-4],index=['b','a','c','d'])print(obj)obj2=obj.reindex(...原创 2019-11-20 21:13:50 · 740 阅读 · 0 评论 -
创建DataFrame数据
创建dataframe的方法有很多,最常用的是传入由数组、列表或元组组成的字典。由于字典是无序的,可以通过columns指定列索引的排列顺序。在没有指定行索引的情况下,会使用0~N-1(N为数据的长度)作为行索引,这里使用其他数据作为行索引。from pandas import Series,DataFrameimport pandas as pdimport numpy as np...原创 2019-11-19 20:41:18 · 1594 阅读 · 0 评论 -
series数据初步
Series数据结构类似于一维数组,但它是由一组数据(各种Numpy数据类型)和一组对应的索引组成。from pandas import Series,DataFrameimport pandas as pdobj=Series([1,-2,3,-4])print(obj)obj2=Series([5,6,7,8],index=['a','b','c','d'])print(obj...原创 2019-11-19 20:17:30 · 341 阅读 · 0 评论 -
图像变换
图像一般采用的是RGB色彩模式,每个像素点的颜色由R(红),G(绿),B(蓝)组成。通过三种颜色的叠加可以得到各种颜色,每个颜色的取值范围是0~255。Python中的PIL库是一个处理图像的第三方库。import numpy as npfrom PIL import Imageim=np.array(Image.open(r'C:\Users\Heisenberg\Desktop\r...原创 2019-11-19 11:15:55 · 173 阅读 · 0 评论 -
数组的存取
import numpy as nparr=np.arange(12).reshape(4,3)np.savetxt('ch2.csv',arr,fmt='%d',delimiter=',')new_arr=np.loadtxt('ch2.csv',delimiter=',')print(new_arr)原创 2019-11-19 10:34:39 · 199 阅读 · 0 评论 -
线性代数
import numpy as nparr1=np.array([[1,2,3],[4,5,6]])print(arr1)arr2=np.arange(9).reshape(3,3)print(arr2)print(np.dot(arr1,arr2))计算矩阵的乘积dot函数。计算行列式import numpy as npfrom numpy.linalg im...原创 2019-11-19 10:30:47 · 117 阅读 · 0 评论 -
集合运算
import numpy as nparr=np.array([1,2,2,3])print(np.unique(arr))print(np.in1d(arr,[1,2]))原创 2019-11-19 10:20:23 · 150 阅读 · 0 评论 -
布尔型数组运算
import numpy as nparr=np.random.randn(20)print(arr)print((arr>0).sum())对于布尔型数组,其布尔值会被强制转换为1(True)和0(False)另外,还有2个方法any和all也可以用于布尔型数组运算。any方法用于测试数组中是否存在一个或多个True;all方法用于检查数组中的所有值是否为True。...原创 2019-11-19 10:10:39 · 2132 阅读 · 0 评论 -
统计函数sum(),mean(),std()
import numpy as nparr=np.random.randn(4,4)print(arr)print('求和',arr.sum())print('算数平均数',arr.mean())print('标准差',arr.std())上面这些函数也可以传入axis参数,用于计算指定轴的方向。import numpy as nparr=np.random.rand...原创 2019-11-19 09:31:53 · 2906 阅读 · 0 评论 -
条件逻辑运算
import numpy as nparr1=np.array([1,2,3,4])arr2=np.array([5,6,7,8])cond=np.array([True,False,False,True])result=[(x if c else y) for x,y,c in zip(arr1,arr2,cond)]print(result)结果:[1, 6, 7, 4]...原创 2019-11-19 09:16:26 · 604 阅读 · 0 评论