《利用Python进行数据分析》笔记
菜鸟学数据分析
这个作者很懒,什么都没留下…
展开
-
5.1.3 索引对象
索引对象是不可变的,不然就会报错 不变性使得在多种数据结构中分享索引对象更为安全 于python不同,pandas索引对象可以包含重复标签 一些索引对象的方法和属性 比如:并集 还有更多更多 ...原创 2020-07-30 17:18:31 · 301 阅读 · 0 评论 -
5.1.2 DataFrame
构建DataFrame head方法显示头部的五行 指定列的顺序 如果传的列不在字典中,将会在结果中出现缺失值 按照字典型标记或属性检索为Series frame2[column]对于任意列名均有效,但是frame2.column只在列名是有效的python变量名时有效 用loc进行选取行 赋值某一列的值 用Series赋值给指定列 del关键字可以删除DataFrame列,先增加一列布尔值,判断state列是否为‘ohio’ del方法可以用...原创 2020-07-30 17:07:09 · 198 阅读 · 0 评论 -
5.1.1 Series
Series是一种一维的数组型对象,包含了一个值序列(类似于Numpy),还有一个索引,从0到n-1(n是数组长度) 可以单独查看数组的值、索引 也可以自定义索引 根据索引找到对应的值 使用布尔值数组进行过滤 ...原创 2020-07-30 11:06:23 · 277 阅读 · 0 评论 -
4.7 示例:随机漫步
使用python内建的random模块实现一个1000步的随机漫步 import random import matplotlib.pyplot as plt position = 0 walk = [position] steps = 1000 for i in range(steps): step = 1 if random.randint(0,1) else -1 #randint(0,1)取0或1,step取1或-1 position += step walk..原创 2020-07-23 15:52:15 · 460 阅读 · 0 评论 -
4.6伪随机数生成
numpy.random模块弥补了Python内奸的random模块的不足,可以高效地生成多种概率分布下的完整样本值数组。 例如,可以用normal来获得一个4*4的正态分布样本数组 import numpy as np samples = np.random.normal(size=(4,4)) samples array([[-0.39778685, 0.10526198, -0.62532053, -0.69857853], [ 1.44776352, 1.083原创 2020-07-23 10:29:18 · 133 阅读 · 0 评论 -
4.5 线性代数
dot函数 import numpy as np x = np.array([[1.,2.,3.],[4.,5.,6.]]) y = np.array([[6.,23.],[-1,7],[8,9]]) x array([[1., 2., 3.], [4., 5., 6.]]) y array([[ 6., 23.], [-1., 7.], [ 8., 9.]]) x.dot(y) array([[ 28., 64.],原创 2020-07-23 10:15:53 · 228 阅读 · 0 评论 -
4.4 使用数组进行文件输入和输出
np.save 和 np.load 是高效存取硬盘数据的两大工具函数,数组在默认情况下是以未压缩的格式进行存储的,后缀名是.npy import numpy as np arr = np.arange(10) np.save('some_array',arr) np.load('some_array.npy') array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 可以使用np.savez并将数组作为参数传递给该函数,用于在未压缩文件中保存多个数组: np.sa.原创 2020-07-22 16:22:18 · 188 阅读 · 0 评论 -
4.3 使用数组进行面向数组编程(2)
all、any any 检查数组中是否至少有一个True,而all检查是否每个值都是true bools = np.array([False,False,True,False]) bools.any() #检查数组中至少有一个True True bools.all() #all检查是否每个值都是True False 排序 arr = np.random.randn(5,3) arr array([[-0.70436114, -0.07774245, 1原创 2020-07-20 00:01:48 · 143 阅读 · 0 评论 -
4.3 使用数组进行面向数组编程(1)
meshgrid import numpy as np points = np.arange(-5,5,0.01) xs,ys = np.meshgrid(points,points) ys array([[-5. , -5. , -5. , ..., -5. , -5. , -5. ], [-4.99, -4.99, -4.99, ..., -4.99, -4.99, -4.99], [-4.98, -4.98, -4.98, ..., -4.98, -原创 2020-07-19 23:43:56 · 138 阅读 · 0 评论 -
4.2 通用函数:快速的逐元素数组函数
原创 2020-07-18 18:14:42 · 114 阅读 · 0 评论 -
4.1 Numpy ndarray:多维数组对象(3)
这是数组转置和换轴!原创 2020-07-18 18:01:44 · 138 阅读 · 0 评论 -
4.1 Numpy ndarray:多维数组对象(2)
来看看神奇的numpy索引吧!原创 2020-07-18 11:38:46 · 244 阅读 · 0 评论 -
4.1 Numpy ndarray:多维数组对象(1)
数据类型~原创 2020-07-18 10:52:44 · 682 阅读 · 0 评论 -
3 内建数据结构、函数及文件
正题之前的热热身,还是很重要的!原创 2020-07-18 00:27:43 · 122 阅读 · 0 评论