Python数据预处理-20220301

..—

于 2022-03-01 20:08:11 发布

阅读量286

点赞数

分类专栏：学习文章标签： python 深度学习机器学习

本文链接：https://blog.csdn.net/weixin_52922697/article/details/123213825

版权

学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

数据清洗过程记录 3.1

首先调试

%pwd
%cd "F:\\python"
%run init.py #自己的包

2导入数据

#dta
f=r'temperature.dta'
tem=pd.read_stata(f)
#csv、xlsx
land_1 = pd.read_csv("land_1.csv")

这里数据过大，思路：拆分两个dta导入py，然后concat

x=pd.concat([x1,x2],axis=0) #=0是行之间的拼接

3查看数据类型\结构

x.columns\x.dtypes\x.iloc[:,-5:-1]\x.drop("name",axis=1)
badrate=data.apply(lambda x:sum(x.isnull())/len(x))#缺失率
data.isnull().sum()
data.rename(columns={'oldname':'newname'},inplace=True)#重命名

如果是面板数据，from datetime import datetime

x['日期'] = pd.to_datetime(x['日期'])

all_data=pd.merge(data, tem, on=['日期', '市代码'])

..—

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python数据预处理-20220301

数据清洗过程记录 3.1首先调试%pwd%cd "F:\\python"%run init.py #自己的包2导入数据#dtaf=r'temperature.dta'tem=pd.read_stata(f)#csv、xlsxland_1 = pd.read_csv("land_1.csv") 这里数据过大，思路：拆分两个dta导入py，然后concatx=pd.concat([x1,x2],axis=0) #=0是行之间的拼接3查看数据类型\结构x.co
复制链接

扫一扫

专栏目录