![](https://img-blog.csdnimg.cn/20190918140012416.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据处理与分析
数据处理与分析专栏
梦码城
以梦为码,不负韶华
展开
-
Matplotlib实现常用图的数据可视化
1.绘制正弦曲线,并设置标题、坐标轴名称、坐标轴范围x = np.linspace(-np.pi2, np.pi2, 256, endpoint=True) # 创建等差一维数组y = np.sin(x)plt.figure() # 定义图像窗口plt.plot(x, y) # 定义曲线plt.xlabel(‘X’) # 设置x坐标轴名称plt.ylabel(‘Y’) # 设置y坐标轴名称plt.title(“Y=Sin(X)”) # 设置标题名称plt.xlim((-np.pi原创 2022-03-30 10:59:48 · 666 阅读 · 0 评论 -
Numpy使用总结
Numpy简介Numpy 的英文全称为 Numerical Python,指Python 面向数值计算的第三方库。Numpy 的特点在于,针对 Python 内建的数组类型做了扩充,支持更高维度的数组和矩阵运算,以及更丰富的数学函数。Numpy 是 Scipy.org 中最重要的库之一,它同时也被 Pandas,Matplotlib 等我们熟知的第三方库作为核心计算库。NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字原创 2022-03-09 11:29:40 · 639 阅读 · 0 评论 -
pandas出图Plot
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# 随机生成1000个数据data = pd.Series(np.random.randn(1000),index=np.arange(1000))# 为了方便观看效果, 我们累加这个数据data = data.cumsum()# pandas 数据可以直接观看其可视化形式data.plot()plt.show()print(data)# Datafr原创 2021-08-19 08:43:46 · 208 阅读 · 0 评论 -
pandas合并merge
import pandas as pd# pandas中的merge和concat类似,但主要是用于两组有key column的数据,统一索引的数据. 通常也被用在Database的处理当中.# 定义资料集并打印出left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'], 'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1',原创 2021-08-19 08:30:09 · 105 阅读 · 0 评论 -
pandas合并concat
import pandas as pdimport numpy as np# 定义资源集合df1 = pd.DataFrame(np.ones((3, 4)) * 0, columns=['a', 'b', 'c', 'd'])df2 = pd.DataFrame(np.ones((3, 4)) * 1, columns=['a', 'b', 'c', 'd'])df3 = pd.DataFrame(np.ones((3, 4)) * 2, columns=['a', 'b', 'c', 'd'原创 2021-08-19 08:01:40 · 218 阅读 · 0 评论 -
pandas数据导入导出
import pandas as pd# 示范档案下载 - 教师.xlsx# 读取exceldata = pd.read_excel('教师.xlsx')# 打印出dataprint(data)# 将资料存取成pickledata.to_pickle('teacher.pickle')原创 2021-08-19 07:38:13 · 192 阅读 · 0 评论 -
pandas处理丢失数据
import pandas as pdimport numpy as np# 建立了一个6X4的矩阵数据并且把两个位置置为空dates = pd.date_range('20130101', periods=6)df = pd.DataFrame(np.arange(24).reshape((6, 4)), index=dates, columns=['A', 'B', 'C', 'D'])df.iloc[0, 1] = np.nandf.iloc[1, 2] = np.nanprint(d原创 2021-08-19 07:29:43 · 85 阅读 · 0 评论 -
pandas设置值
import pandas as pdimport numpy as npdates = pd.date_range('20130101', periods=6)df = pd.DataFrame(np.arange(24).reshape((6, 4)), index=dates, columns=['A', 'B', 'C', 'D'])print(df)# 根据位置设置 loc 和 ilocdf.iloc[2, 2] = 1111df.loc['20130101', 'B'] = 22原创 2021-08-11 15:25:57 · 149 阅读 · 0 评论 -
pandas选择数据
import pandas as pdimport numpy as npdates = pd.date_range('20130101', periods=6)df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=['A', 'B', 'C', 'D'])print(df)# 获取列数据print(df['A'])print(df.A)# 选择跨越多行或多列:print(df[0:3]) # 多行(取左不取右)p原创 2021-08-11 15:15:56 · 79 阅读 · 0 评论 -
pandas基本操作
import pandas as pdimport numpy as np# Numpy 和 Pandas 有什么不同# 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。# 要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame。# Series:Series的字符串表现形式为:索引在左边,值在右边。由于我们没有原创 2021-08-11 14:55:31 · 97 阅读 · 0 评论 -
numpy数组赋值和数组copy
import numpy as npa = np.arange(4)b = aa[0] = 11print(a)print(b)# b 的值会随着a的改变而变化# [11 1 2 3]# [11 1 2 3]# copy() 的赋值方式没有关联性b = a.copy()a[2] = 11print(a)print(b)# [11 1 11 3]# [11 1 2 3]...原创 2021-08-11 14:28:51 · 280 阅读 · 0 评论 -
numpy分割array
import numpy as npa = np.arange(12).reshape((3, 4))print(a)# 纵向分割c = np.split(a, 2, axis=1)c = np.hsplit(a, 2)# 横向分割c = np.split(a, 3, axis=0)c = np.vsplit(a, 3)# 不等量分割c = np.array_split(a, 3, axis=1)print(c)原创 2021-08-11 14:23:05 · 125 阅读 · 0 评论 -
numpy合并array
import numpy as npa = np.ones((3))b = np.array([1, 2, 3])# vertical stack本身属于一种上下合并,即对括号中的两个整体进行对应操作。c = np.vstack((a, b))print(a.shape)print(a)# 左右合并c = np.hstack((a, b))# np.newaxis() 矩阵转置print(a[np.newaxis, :])# [[1 1 1]]print(a[np.newaxi原创 2021-08-11 14:10:41 · 2623 阅读 · 0 评论 -
numpy索引
import numpy as npa = np.arange(3, 15)a = np.arange(3, 15).reshape((3, 4))# print(a[2])# print(a[2][1])# print(a[1, 1])print(a)print(a[1, 1:3]) # 取左不取右# 按行遍历for row in a: print(row)# 按列遍历for column in a.T: print(column)# 迭代输出# flatte原创 2021-08-11 13:43:37 · 117 阅读 · 0 评论 -
numpy基础运算
import numpy as np# a 和 b 是两个属性为 array 也就是矩阵的变量,而且二者都是1行4列的矩阵, 其中b矩阵中的元素分别是从0到3。a = np.array([10, 20, 30, 40])b = np.arange(4)# 矩阵减法c = a - b# 矩阵加法c = a + b# 矩阵乘法c = a * b# array([ 0, 20, 60, 120])# 矩阵的乘方c = b ** 2# 三角函数c = 10 * np.sin(a)原创 2021-08-11 13:33:58 · 96 阅读 · 0 评论 -
numpy创建array
import numpy as np# 关键字:# array:创建数组# dtype:指定数据类型# zeros:创建数据全为0# ones:创建数据全为1# empty:创建数据接近0# arrange:按指定范围创建数据# linspace:创建线段# 创建数组a = np.array([1, 2, 3, 4])print(a)# 指定数据的dtypea = np.array([1, 2, 3, 4], np.int)a = np.array([1, 2, 3, 4],原创 2021-08-11 13:33:06 · 695 阅读 · 0 评论 -
numpy属性
import numpy as np# 列表转换为矩阵array = np.array([[1, 2, 3], [2, 3, 4]])print(array)# 维度print('number of dim: ', array.ndim) # 维度print('shape: ', array.shape) # 行数和列数print('size: ', array.size) # 元素个数原创 2021-08-11 13:31:33 · 64 阅读 · 0 评论