25号:关于Pandas在python中的应用技术总结
- 将用户所自己填写或者爬虫爬下来的日期数据转化为DataFrame中的日期格式。`
data1["日期"]=pd.to_datetime(data1["日期"])
- 将日期属性进行排序
data1.sort_values(by="日期",inplace= True)
- 将日期属性变为主要排序索引,然后可以利用loc进行以日期为单位的数据查询
data1.set_index(pd.to_datetime(data1["日期"]),inplace= True)
- 查找数据中以2018为时间的数据
data_2018=data1.loc["2018"]
- 获取2018年中每月月初数据,并筛选,其中index.month可以换为index.week(周)index.quarter(季)
data_min_2018=data_2018.groupby(data_2018.index.month)["日期","中间价"].min()
- 如果2张表的其他属性一样,只有一个日期属性不一样,我们可以用append来连接2张表,仅限2张,不可多表连接
r= data_min_2018.append(data_min_2019)
r=r.append(data_min_2020)
- 将形成的数据写入新的csv文件,可以用pandas的函数进行写入。
r.to_csv("XXXXXX.csv",index=False)