import numpy
data = numpy.array(range(48)).reshape(6, 8)
# print(data)
import pandas
data = pandas.DataFrame(data, index=list('abcdef'), columns=list('ABCDEFGH'))
# print(data)
data["H"] = 'cn/us/uk' # 对列赋值
# print(data)
# print(data[data["H"].str.len() > 1]) # 布尔索引 对字符串长度限制选取
# print(data['H'].str.split('/'))
data['H'] = data['H'].str.split('/') # 按空格分割 Series格式 .tolist()列表格式
data.loc["f", ['G', 'H']] = numpy.nan
# print(pandas.isnull(data)) # 数据是不是NaN
# print(pandas.notnull(data)) # 数据是不是非NaN
# print(pandas.notna(data)) # 数据是不是非NaN
# print(pandas.isna(data)) # 数据是不是NaN
# print(data[pandas.isna(data['H'])])
# print(data.dropna(axis=0)) # 删除含nan的行
# print(data.dropna(axis=1)) # 删除含nan的列
# print(data.dropna(axis=0, how='all')) # 删除全为nan的行
# print(data.dropna(axis=0, how='any')) # 删除只要含有nan的行
# data.dropna(axis=0, how='any', inplace=True) # 删除只要含有nan的行,并替换自身
# print(data)
# print(data.fillna(0, inplace=True)) # 将nan位置填充为0
# print(data.fillna(data.mean())) # 将nan位置填充为平均值
# print(data.fillna(data.median())) # 将nan位置填充为中值
# print(data['G'].fillna(data['G'].max(),inplace=True)) # 对某列nan位置填充
# print(data)
# data[data == 0] = numpy.nan # 处理为0的数据
# print(data)
Python numpy pandas文本处理
最新推荐文章于 2023-06-07 11:29:42 发布