Python numpy pandas文本处理

最新推荐文章于 2023-06-07 11:29:42 发布

如果写个动物世界

最新推荐文章于 2023-06-07 11:29:42 发布

阅读量233

点赞数

分类专栏：数据处理文章标签： python numpy 数据分析

本文链接：https://blog.csdn.net/weixin_43505540/article/details/105631879

版权

数据处理专栏收录该内容

8 篇文章 1 订阅

订阅专栏

import numpy

data = numpy.array(range(48)).reshape(6, 8)
# print(data)
import pandas

data = pandas.DataFrame(data, index=list('abcdef'), columns=list('ABCDEFGH'))
# print(data)
data["H"] = 'cn/us/uk'  # 对列赋值
# print(data)
# print(data[data["H"].str.len() > 1])  # 布尔索引 对字符串长度限制选取
# print(data['H'].str.split('/'))
data['H'] = data['H'].str.split('/')  # 按空格分割   Series格式   .tolist()列表格式
data.loc["f", ['G', 'H']] = numpy.nan
# print(pandas.isnull(data))  # 数据是不是NaN
# print(pandas.notnull(data))  # 数据是不是非NaN
# print(pandas.notna(data))  # 数据是不是非NaN
# print(pandas.isna(data))  # 数据是不是NaN
# print(data[pandas.isna(data['H'])])
# print(data.dropna(axis=0))  # 删除含nan的行
# print(data.dropna(axis=1))  # 删除含nan的列
# print(data.dropna(axis=0, how='all'))  # 删除全为nan的行
# print(data.dropna(axis=0, how='any'))  # 删除只要含有nan的行
# data.dropna(axis=0, how='any', inplace=True)  # 删除只要含有nan的行,并替换自身
# print(data)
# print(data.fillna(0, inplace=True))  # 将nan位置填充为0
# print(data.fillna(data.mean()))  # 将nan位置填充为平均值
# print(data.fillna(data.median()))  # 将nan位置填充为中值
# print(data['G'].fillna(data['G'].max(),inplace=True))  # 对某列nan位置填充
# print(data)
# data[data == 0] = numpy.nan  # 处理为0的数据
# print(data)