【python-数据分析-numpy】文件操作&读取csv文件&NAN NF
文件操作
savetxt(文件名,数组,数据格式,分隔符)
存储
读取
numpy独有的存储方式:save & load 可以读取多维数组,但是要求表格内的格式较为统一
读取csv文件
csv文件
读取csv文件reader()
略过标题数据:
转成字典,以key的方式索引:DictReader()
之前通过行标列标,假如移动行列就索引不到了,用字典就不用担心这种问题。
写入
writerow()
问题:乱码&每行中间有空行
解决方式
newline=‘’
以字典方式写入:DictWriter
记得表头自己导入
NAN NF(为str类型)
简介
NAN注意事项
1.NAN与任何NAN不相等
2.NAN与任何值做运算,结果仍为NAN
处理NAN
删除缺失值
布尔索引
用其他值进行替换
根据不同情形进行相应替换
有缺失值怎么办
1.使用字符串类型进行解析dtype=np.str
把不能转换成数字的数据转换成NAN,转换完之后再转换成浮点类型
例题
注:除了delete函数,axis=1都代表为行,=0代表为列;delete函数正好相反。
求总分可以将某个人的某科目分设置为0.
求平均值的时候要将缺失值设置为平均值。