立即学习:https://edu.csdn.net/course/play/26990/361123?utm_source=blogtoedu
数据筛选:直接引用,选择行列,基础索引,loc和iloc,如何区分
import三个库:pandas as pd,os, numpy as np
os.chdir(‘数据存放路径’)
读取 变量 = pd.read_csv(‘文件名称’, encoding=‘’,dtype= {‘某一列名’:str})
df.info()对数据进行简单的探索,比如多少行,多少变量,每个column数据类型等
df.head () 查看下数据前几行是什么样子的
df.columns 是数据的列名称,也叫变量名称或者叫数据的字段
如果只想要一列,简单索引方式:df【‘列名’】但是如果要两列,就要以嵌套列表的形式df[[‘列名1’,’列名2’]].head(5)这里是显示前五行的意思。取多个字段要写两层。如果只想要第二行到第五行就[1:5]这里是左闭右开,因此是包含1但不包含5,第二行到第五行
loc只能选标签,比如loc[3:4]就会把索引标签为3的和索引标签为4的给取出来,loc定义的是标签,也就是这里的3和4不再是位置而是标签了
如果不想选择行但是想选择列,并以列表形式传递进去。则: