前言
不管是在机器学习的预处理阶段还是其他工作中,利用Python的Pandas库进行数据处理带来了很大的便利,但是在高效便利的同时,需要的是自己对pandas操作的熟练,本文将记录自己使用pandas中常用的操作。
import pandas as pd
1. 读取文件
(1) CSV文件:read_csv()读取文件, head()查看首五条数据
2. 设置索引
(1)读取文件后再设置某列为索引,注意一定要重新赋值回去(否则jupyter notebook 会直接显示结果,造成已经改变了原DataFrame数据假象)
3. 查看指定列元素
(1) 直接传入列名组成的数组,或者可以先定义一个数组,如:colums=['DN','company','userAccountControl'],
data[columns]即可查看,效果同下。
4. 定位某行元素
loc[index], index同为数组