python中的数据框中常见操作

最新推荐文章于 2024-08-23 08:00:00 发布

yes banana

最新推荐文章于 2024-08-23 08:00:00 发布

阅读量1.8k

点赞数 1

文章标签： python

本文链接：https://blog.csdn.net/weixin_48092025/article/details/121906843

版权

本文介绍了Python数据框的常见操作，包括将dataframe转换为array、数据标准化、删除列、字符串到数字映射、变量划分、保存为xlsx、创建虚拟变量、查看列内容以及在Mac上设置中文字体显示。

摘要由CSDN通过智能技术生成

python中的数据框中常见操作

1.dataframe转变为array

df.values

2.数据标准化

X = preprocessing.scale(X)

3.数据框中删除列

df.drop(['a', 'b'], 1, inplace=True)

4.把数据框中的字符串映射为数字
例如{female:1, male:0}

df_map = {}
cols = df.columns.values
for col in cols:
    if df[col].dtype != np.int64 and df[col].dtype != np.float64:
        temp = {}
        x = 0
        for ele in set(df[col].values.tolist()):
            if ele not in temp:
                temp[ele] = x
                x += 1
        df_map[df[col].name] = temp
        df[col] = list(map(lambda val: temp[val], df[col]))

5.划分列为自变量和因变量

data= pd.read_csv('/Users/rb/Desktop/数据.csv')
wn0=data.columns 
wn=wn0[0:] 
X=data[wn[0:21]]#选择前20个作为自变量
y=data[wn[21]]#选择因变量

6.把数据另存为桌面的xlsx格式

最低0.47元/天解锁文章

yes banana

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫