数据预处理(读取txt文件的数据、去除(含有)NAN所在行/列)

1、读取txt文件的两种方法

(1) numpy的loadtxt()函数

这个函数要求txt中都是数值,不能有字符,且返回的data的数据类型是numpy.ndarray。
我的txt数据是每行一个数,有n列,所以参数delimiter='\n'

import numpy as np
path = r"C:\123456\test.txt"

def LoadTxtData(filename):
	data = np.loadtxt(filename, dtype=np.float32, delimiter='\n')
    return data

mydata = LoadTxtData(path)
print(type(mydata)) #看一下什么类型,便于后续进行其他处理
print(mydata)

(2) pandas的read_table()函数

这个函数不要求txt中全是数值,返回的data类型是DataFrame。

import pandas as pd
path = r"C:\123456\test.txt"

def LoadTxtTestData(filename):
    data = pd.read_table(filename,header=None, sep='\n')
    return data
    
mydata = LoadTxtTestData(path)
print(type(mydata)) #看一下什么类型,便于后续进行其他处理
print(mydata)

2、删除DataFrame中NAN所在行/列

删除表中全部为NAN的行:

df.dropna(axis=0, how='all')

删除表中含有NAN的行:

df.dropna(axis=0, how='any')

删除表中全部为NAN的列:

df.dropna(axis=1, how='all')

删除表中含有NAN的列:

df.dropna(axis=1, how='any')
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值