导入pandas
import pandas as pd
pd.read_csv 读取csv文件
df = pd.read_csv('Titanic.csv') ‘Titanic.csv’文件
pd.read_csv 读取xlsx文件
df _score = pd.read_execel('score.xlsx')
df_imdb = pd.read_csv('IMDB.csv')
df_imdb.columns
df_imdb[''Title] 电影名称 = df_imdb.Title
df_imdb[''Title] 电影名称 = df_imdb.Title
df_imdb['Title'].head(3) 前三个
df_imdb['Revenue(Millions)'].max()获取最高票房
df_imdb['Revenue (Millions)'].idxmax()
df_imdb[50:51]
将DataFrame 第50行数据的Director列取出,取一到6的数据的时候不会吧6取出来
df_imdb[50:51]['Director']选出的导演
第一个维度是行,第二维度是列,将50到56行(包含50和56)的导演和年份取出来
df_imdb.loc[50:56,['Director','Year']]
df_imdb.iloc[1:10,2:3] 将1到10行(不包含第10行,及2到3列 不包含3列)取出,使用整数索引caozuo
df _imdb[df_imdb['Revenue (Millions)',]>100]['Director']将票房大于5亿美元的电影选出来 支持
df[df['Genre'].str.contains('Thriller')].含有恐怖片的