pandas数据表的操作之简单筛选+查询+增删改查(1)
本篇主要针对pandas数据表做一些基础操作
一、简单筛选
1.1 通过索引查看
import pandas as pd
import numpy as np
basic = pd.read_excel('某文件.xls') # gbk是中文编码,utf-8是默认编码
# 1:简单筛选
basic.head(5) # 查看前5行
basic.tail(5) # 查看后5行
basic.columns # 查看变量名称
basic.columns.tolist()
basic.dtypes # 查看变量类型
# basic.info()
# print('农户基本数据的个数:', basic.size)
# print('农户基本数据的维度个数为:', basic.ndim)
# print('农户基本数据的形状为:', basic.shape)
# 注意pandas与numpy索引方式的区别
basic[:5] # 前5行
basic['农户生产经营类型'][:5] # 选择该变量的前5行
basic[['户主姓名', '农户生产经营类型']][:5] # 选择两个变量的前5行
# 单独选择列
basic['农户生产经营类型']
basic.农户生产经营类型
basic[['户主姓名', '健康状况']] # 选择多个变量
basic.head(10)
1.2 通过iloc和loc查询
'''
比较loc和iloc的用法
• loc[行索引名称或者条件,列索引名称或者标签]
• iloc[行索引位置,列索引位置]
'''
# 先看loc用法
basic.columns
basic.loc[:, '健康状况'] # 选择某一列a
basic.loc[:, ['性别', '出生年月', '健康状况']] # 选择多列
basic.loc[:, '户主身份证号':'入股方式'] # 选择多列,可以按照这种方式
basic.loc[0:2, ['户主姓