前言
b站脏果君分享的视频
Python数据分析三剑客 数学建模基础 numpy、pandas、matplotlib
Pandas读取数据及数据操作
以豆瓣的电影数据作为我们深入了解Pandas的示例
注意:需要pip install xlrd==1.2.0
import numpy as np
import pandas as pd
mv_data = mv_data=pd.read_excel(r"C:\Users\happy\Desktop\dataset\zangguojun\豆瓣电影数据.xlsx")
行索引,列索引,数据值
mv_data.index
mv_data.columns
mv_data.values
行操作.iloc 或者 .loc
mv_data.iloc[0]
mv_data.iloc[0:5]
mv_data.loc[0:5] # 左闭右闭
删除一行
mv_data = mv_data.drop([0])
列操作
mv_data.columns
mv_data["名字"][0:5]
mv_data[['名字','类型']][:5]
增加一列
mv_data['序号']=range(1,len(mv_data)+1)
删除一列
mv_data = mv_data.drop("序号", axis=1)
通过标签选择数据
df.loc[[index],[column]]通过标签选择数据
mv_data.loc[[1,3,4],['名字','评分']]
条件选择
mv_data[mv_data['产地']=='中国大陆'][:5]
mv_data[(mv_data.产地=='美国')&(mv_data.评分>9)].head()
mv_data[((mv_data.产地=='美国')|(mv_data.产地=='中国大陆'))&(mv_data.评分>9)].head()