![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析相关知识
lvbu89757
这个作者很懒,什么都没留下…
展开
-
numpy生成数组
numpy生成数组随机生成数组随机生成维度大小为3*4*5的数组nd1=np.random.rand(3,4,5)print(nd1)print(type(nd1))维度(dimension)个数print('nd1.ndim)维度大小print(nd1.shape)维度数据类型print(nd1.dtype)输出结果随机生成指定数据范围的数组生成一个数据范围为[...原创 2019-07-29 14:56:39 · 7455 阅读 · 0 评论 -
pandas 自定义函数操作 排序 Serials层级索引,层级索引转DF对象,DF对象转置
pandas 自定义函数操作df1=pd.DataFrame(np.random.randint(-10,10,(4,5)),columns=list('abcde'))print(df1)print()def func(x): num=np.max(x)-np.min(x) return num按行列进行自定义运算app1=df1.apply(func,axis=0...原创 2019-08-06 14:54:25 · 666 阅读 · 0 评论 -
pandas去零 去重 修改内容 求和
pandas去空 对齐运算去空df6=pd.DataFrame([np.random.randint(10,50,4),[1.1,2.2,3.3,],[np.NAN,1,2,3]])print(df6)判断单个元素是否为空ret=df6.isnull()print(ret)print()和上面的相反ret2=df6.notnull()print(ret2)print('###...原创 2019-08-06 14:26:14 · 582 阅读 · 0 评论 -
pandas基本操作,生成数组
pandas基本操作,生成数组Series方法改变索引名字ser_obj=pd.Series(list('asdf'))print(ser_obj)print(ser_obj.index)print(ser_obj.values)print('############')print(type(ser_obj.index))print(type(ser_obj.values))...原创 2019-08-02 09:43:42 · 6468 阅读 · 0 评论 -
通过numpy分析一个csv文件
通过numpy分析一个csv文件代码部分arr3=np.genfromtxt('国际数据主要国家(地区)年度数据.csv',delimiter=',',dtype=str,encoding='utf-8')获取国家,地区数值key=arr3[4,1:]ret=np.argwhere(arr3=='阿富汗')print(ret)查找伊朗2009年人口数据index1=np.argwh...原创 2019-08-01 17:06:54 · 652 阅读 · 0 评论 -
pandas对齐操作
pandas对齐操作Seriesser2=pd.Series(data=range(10,15),index=list('abcde'))ser3=pd.Series(data=range(20,25),index=list('cdefg'))print()print(ser2)print()print(ser3)print('#######')print()对齐相加,如果无法...原创 2019-08-05 16:54:27 · 5318 阅读 · 0 评论 -
numpy 集合函数 数组排序 文件读写
numpy 集合函数导包import numpy as np数组去重uniqueunique不仅去重,还以升序排列了数据交集intersect1d并集union1d差集setdiff1d元素的顺序对结果有关系对称差集setxor1d为两者并集减去交集...原创 2019-07-31 11:49:44 · 251 阅读 · 0 评论 -
numpy 数组的增加,删除,插入,合并
数组的增加,删除,插入,合并首先导包import numpy as npappend()在数据末尾做追加,有返回值,不改变原来数组的结构如果是多维数组,append后变成一维数组,在末尾添加如果是多维数组添加多维数组,append后也变成一维数组arr1=np.arange(10,20)arr2=np.arange(20,30)arr3=np.arange(20).reshape(...原创 2019-07-31 11:20:53 · 52526 阅读 · 1 评论 -
numpy 统计函数 判断函数
numpy 统计函数 判断函数统计函数参数axis参数axis是按轴计算,0为列,1为行mean()求平均值sum()求和max()最大值min()最小值std()标准差var()方差argmax()最大值下标索引argmin()最小值下标索引cumsum()所有元素都是最前元素的累加,一维数组cumprod()所有元素都是之前的元素的累乘,一维数组...原创 2019-07-31 10:01:38 · 595 阅读 · 0 评论 -
pandas 索引切片
pandas 索引切片Seriesser1=pd.Series(range(10,15),index=list('ABCDE'))print(ser1)普通索引print(ser1['A'])print(ser1[0])print('#############')注意通过自定义索引的左闭右闭的,用默认索引(下标)是左闭右开的print(ser1['A':'C'])print(s...原创 2019-08-02 20:26:39 · 1240 阅读 · 0 评论 -
numpy 多元运算函数
多元运算函数二元运算函数传两个参数的函数arr1=np.arange(10).reshape((2,5))arr2=np.arange(10,20).reshape((2,5))print(arr1)print(arr2)print('add')相加函数print(np.add(arr1,arr2))print('subtract')相减函数print(np.subtrac...原创 2019-07-30 14:49:22 · 482 阅读 · 0 评论 -
numpy 通用函数
通用函数ceil floor rint abs nevigate square sqrt modf isnanceil向上取整,floor向下取整,rint四舍五入,abs取绝对值,nevigate消极的,square平方,sqrt平方根,modf将小数部分和整数部分分开,isnan 查询是否为空arr1=np.random.uniform(-5,10,(3,4))print(arr1)...原创 2019-07-30 11:23:04 · 494 阅读 · 2 评论 -
numpy数组索引与切片
数组索引一维数组索引arr1=np.arange(10)print(arr1)取第一个print(arr1[0])取最后一个print(arr1[-1])取数组中[0,3)print(arr1[0:3])取数组[0,3)步长(step)为2print(arr1[0:3:2])二维数组arr1=np.random.randint(0,99,(3,4))print(ar...原创 2019-07-30 10:52:07 · 428 阅读 · 0 评论 -
numpy 数组运算
数组运算一维数组运算arr1=np.arange(1,6)arr2=np.array([10,20,30,40,50])print(arr1)print(arr2)print(arr1+arr2)print('##############')print(arr1*arr2)输出结果原创 2019-07-30 09:41:31 · 267 阅读 · 0 评论 -
pandas 统计 数据链接
pandas 统计 数据链接统计df1=pd.DataFrame(np.random.randint(-10,10,(4,5)),index=list('ABCD'),columns=list('abcde'))print('df1','\n',df1)print()求和print(df1.sum())print(df1.sum(axis=1))print()平均值print(...原创 2019-08-06 15:07:24 · 162 阅读 · 0 评论