![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
文章平均质量分 62
zi_ying123
这个作者很懒,什么都没留下…
展开
-
Numpy数据存取
Numpy数据存取numpy提供了便捷的内部文件存取,将数据存为np专用的npy(二进制格式)或npz(压缩打包格式)格式 npy格式以二进制存储数据的,在二进制文件第一行以文本形式保存了数据的元信息(维度,数据类型),可以用二进制工具查看查看内容 npz文件以压缩打包文件存储,可以用压缩软件解压import numpy as npa = np.array([['张三','李四','王五','赵六'],['11','12','13','14','15']])b = a = np.arang原创 2021-04-10 11:13:53 · 1077 阅读 · 0 评论 -
Pandas分类,&绘图, &时间序列
Pandas分类categorical data是指分类数据:数据类型为:男女、班级(一班、二班)、省份, 使用赋值法给变量赋值,例如(男=1,女=0),数字1, 0之间没有大小之分,不能认为1是比0大的 numerical data是指数值型数据:收入(1000元,500元),是可以进行比较大小并进行运算的数据。从0.15版本开始,pandas可以在DataFrame中支持Categorical类型的数据,Pandas可以在DataFrame中包含分类数据df = pd.DataF..原创 2021-04-10 11:11:53 · 1204 阅读 · 1 评论 -
pandas数据操作,& 数据排序, & 数据类型运算
字符串方法Series对象在其str属性中配备了一组字符串处理方法,可以很容易的应用到数组中的每个元素t = pd.Series(['a_b_c_d','c_d_e',np.nan,'f_g_h'])tt.str.cat(['A','B','C','D'],sep=',') #拼接字符串t.str.split('_') #切分字符串t.str.get(0) #获取指定位置的字符串t.str.replace("_", ".") #替换字符串t.str.pad(10, fillc原创 2021-04-10 11:00:00 · 266 阅读 · 0 评论 -
Pandas统计分析, 数据存取
pandas数据的基本统计分析和numpy的函数近似dates = pd.date_range('20130101',periods=10)datesdf = pd.DataFrame(np.random.randn(10,4),index=dates,columns=['A','B','C','D'])dfdf.describe() #快速统计结果df.mean() # 按列求平均值df.mean(1) # 按行求平均值基本统计分析函数.describe()针对0轴(列.原创 2021-04-10 10:52:57 · 224 阅读 · 1 评论 -
Pandas缺失数据处理, 数据规整
Pandas用np.nan代表缺失数据reindex()可以修改索引,会返回一个数据的副本:df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D','E'])df1df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D']+['E'])df1df1 = df.reindex(index=dates[0:4], columns=list(df.columns)..原创 2021-04-10 10:50:08 · 80 阅读 · 0 评论