Python3数据科学汇总: https://blog.csdn.net/weixin_41793113/article/details/99707225
import numpy as np
import pandas as pd
from pandas import Series, DataFrame
pwd ##可以查看当前文件所在的路径及文件夹
##同样 ls Users\\EE\\Desktop\\Python3数据科学\\homework 可以查看此文件夹下的目录信息
找到路径就可以读入数据了,不过这里我们可以使用相对路径,再不济我们可以复制csv到同一目录
imdb = pd.read_csv('..\\homework\\movie_metadata.csv') #读入数据
imdb.shape ##查看数据的形状
(5043, 28)
imdb.head() ##查看前5行
## df.head()是可以传入参数的,比如:
imdb[['color','director_name']] ##只查看这2个索引所在的列
sub_df = imdb[['director_name', 'movie_title','imdb_score']]
sub_df.head(5)
tmp_df = sub_df.iloc[10:20,0:2]
tmp_df
## 截取前[L,R)行,[L,R)列,都是左闭右开的区间
tmp_df.iloc[2:4,:] ##在新的df里面还可以再截
下面是一些常规操作