最近学习AI的强有力工具Python。
看到南京大学 的 用python玩转数据视频,有一个计算标准差的作业,现分享如下
import pandas as pd # 导入评分数据 ratingData=pd.read_table(r"F:\testDemo\Python\ml-100k\ml-100k\u.data",sep='\t',names=['userid','itemid','rating','timestamp'],usecols=['userid','itemid','rating']) #print(ratingData.groupby('userid').size()) #导入用户信息 userData=pd.read_table(r"F:\testDemo\Python\ml-100k\ml-100k\u.user",sep='|',names=['userid','age','gender'],usecols=['userid','age','gender']) #合并 merggData=pd.merge(ratingData,userData,on='userid') meanDataM=merggData[merggData.gender=='M'].groupby('userid').rating.mean().std() meanDataF=merggData[merggData.gender=='F'].groupby('userid').rating.mean().std() #将结果存入文本 with open(r'f:\testDemo\Python\movieresult.txt','w') as f: f.write("{:.0f}{:.0f}".format(meanDataM*100, meanDataF*100) )
这个作业 主要是检查对 read_table,merge的使用,可以参考官方文档
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_table.html
http://pandas.pydata.org/pandas-docs/stable/merging.html
或者直接使用help(pd.read_table)查看说明
知乎: https://zhuanlan.zhihu.com/albertwang
微信公众号:AI-Research-Studio
下面是赞赏码