这期的Python基础学习教程接着上期的讲,上面一期的Python基础教程大家都掌握的怎么样啊,有没懂的地方,可以留言哈!
1.计算布尔值统计信息
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title') #判断电影时长是否超过两个小时 #Figure1 movie_2_hours = movie['duration'] > 120 #统计时长超过两小时的电影总数 print(movie_2_hours.sum()) #result:1039 #统计时长超过两小时的电影的比例 print(movie_2_hours.mean()) #统计False和True的比例 print(movie_2_hours.value_counts(normalize = True)) #比较同一个DataFrame中的两列 actors = movie[['actor_1_facebook_likes','actor_2_facebook_likes']].dropna() print((actors['actor_1_facebook_likes'] > actors['actor_2_facebook_likes']).mean()) #Figure2
运行结果: