Python numpy pandas文本处理

import numpy

data = numpy.array(range(48)).reshape(6, 8)
# print(data)
import pandas

data = pandas.DataFrame(data, index=list('abcdef'), columns=list('ABCDEFGH'))
# print(data)
data["H"] = 'cn/us/uk'  # 对列赋值
# print(data)
# print(data[data["H"].str.len() > 1])  # 布尔索引 对字符串长度限制选取
# print(data['H'].str.split('/'))
data['H'] = data['H'].str.split('/')  # 按空格分割   Series格式   .tolist()列表格式
data.loc["f", ['G', 'H']] = numpy.nan
# print(pandas.isnull(data))  # 数据是不是NaN
# print(pandas.notnull(data))  # 数据是不是非NaN
# print(pandas.notna(data))  # 数据是不是非NaN
# print(pandas.isna(data))  # 数据是不是NaN
# print(data[pandas.isna(data['H'])])
# print(data.dropna(axis=0))  # 删除含nan的行
# print(data.dropna(axis=1))  # 删除含nan的列
# print(data.dropna(axis=0, how='all'))  # 删除全为nan的行
# print(data.dropna(axis=0, how='any'))  # 删除只要含有nan的行
# data.dropna(axis=0, how='any', inplace=True)  # 删除只要含有nan的行,并替换自身
# print(data)
# print(data.fillna(0, inplace=True))  # 将nan位置填充为0
# print(data.fillna(data.mean()))  # 将nan位置填充为平均值
# print(data.fillna(data.median()))  # 将nan位置填充为中值
# print(data['G'].fillna(data['G'].max(),inplace=True))  # 对某列nan位置填充
# print(data)
# data[data == 0] = numpy.nan  # 处理为0的数据
# print(data)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值