一.使用pandas,numpy读入数据
例如:import pandas as pd
import numpy as np
df=pd.read_csv(r'文件地址',encoding='gbk')
二.1.函数isnull 缺失值 ——— df【'查找文件目录名'】.isnull().sum()
notnull 为数据库约束中的非空约束。其作用为限制表中该列数据不可为空。
df【'文件目录名'】.notnull().sum()
2.乱码
3.处理缺失值
扔掉:dropna()删除含有空值和缺失值的行或列
填充、替换:fillna
value :用于填充的数值
method:表示填充方式,默认值为None
limit:可以连续填充的最大数值,默认None