python在职场竞争力越来越强,我这个从来不喜欢碰代码的人也不得不硬着头皮捧起教程和课本研究。学完廖雪峰的课程之后就开始读书,结果在捧着python必读书《利用python学习数据分析》时,发现里面的例子所使用的函数和字段难免有错误和过时之处,便想把自己的学习过程整理下来,方便为python困扰的朋友一起学习进步。
本次学习是《利用python学习数据分析》的第二章内容:电影评分数据分析
数据源:
1. 对解压出来的文件用pd.read.table函数进行读取,python代码如下:
import pandas as pd
unames=['user_id','gender','age','occupation','zip']
users=pd.read_table('ml-1m/users.dat',sep='::',header=None,names=unames)
rnames=['user_id','movie_id','rating','timestamp']
ratings=pd.read_table('ml-1m/ratings.dat',sep='::',header=None,names=rnames)
mnames=['movie_id','title','genres']
movies=pd.read_table('ml-1m/movies.dat',sep='::',header=