Python基础学习教程：Pandas知识点汇总2——布尔索引

最新推荐文章于 2024-08-01 17:23:40 发布

千锋python和唐唐

最新推荐文章于 2024-08-01 17:23:40 发布

阅读量274

点赞数

分类专栏： Python学习教程 Python 文章标签： Python Python学习教程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chen801090/article/details/103477343

版权

Python 同时被 2 个专栏收录

326 篇文章 9 订阅

订阅专栏

Python学习教程

117 篇文章 4 订阅

订阅专栏

这期的Python基础学习教程接着上期的讲，上面一期的Python基础教程大家都掌握的怎么样啊，有没懂的地方，可以留言哈！

1.计算布尔值统计信息

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')

#判断电影时长是否超过两个小时 #Figure1
movie_2_hours = movie['duration'] > 120

#统计时长超过两小时的电影总数
print(movie_2_hours.sum()) #result:1039
#统计时长超过两小时的电影的比例
print(movie_2_hours.mean())
#统计False和True的比例 
print(movie_2_hours.value_counts(normalize = True)) 
#比较同一个DataFrame中的两列
actors = movie[['actor_1_facebook_likes','actor_2_facebook_likes']].dropna()
print((actors['actor_1_facebook_likes'] > actors['actor_2_facebook_likes']).mean()) #Figure2

运行结果：

Python基础学习教程：Pandas知识点汇总2——布尔索引

Figure1

Python基础学习教程：Pandas知识点汇总2——布尔索引

Figure2

2. 构建多个布尔条件

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')

#创建多个布尔条件
criteria1 = movie.imdb_score > 8
criteria2 = movie.content_rating == "PG-13"
criteria3 = (movie.title_year < 2000) | (movie.title_year >= 2010)

"""
print(criteria1.head())
print(criteria2.head())
print(criteria3.head())
运行结果：Figure1
"""

#将多个布尔条件合并成一个
criteria_final = criteria1 & criteria2 & criteria3 

print(criteria_final.head())
#运行结果：Figure2

运行结果：

Python基础学习教程：Pandas知识点汇总2——布尔索引

Figure1

Python基础学习教程：Pandas知识点汇总2——布尔索引

Figure2

3.用布尔索引过滤

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')
#创建第一个布尔条件
crit_a1 = movie.imdb_score > 8 
crit_a2 = movie.content_rating == 'PG-13'
crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)
final_crit_a = crit_a1 & crit_a2 & crit_a3

#创建第二个布尔条件
crit_b1 = movie.imdb_score < 5
crit_b2 = movie.content_rating == 'R'
crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)
final_crit_b = crit_b1 & crit_b2 & crit_b3

#将两个条件用或运算合并起来
final_crit_all = final_crit_a | final_crit_b
print(final_crit_all.head()) #Figure 1 

#用最终的布尔条件过滤数据
print(movie[final_crit_all].head()) #Figure2

运行结果：

Python基础学习教程：Pandas知识点汇总2——布尔索引

Figure1

Python基础学习教程：Pandas知识点汇总2——布尔索引

Figure2

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')
#创建第一个布尔条件
crit_a1 = movie.imdb_score > 8 
crit_a2 = movie.content_rating == 'PG-13'
crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)
final_crit_a = crit_a1 & crit_a2 & crit_a3

#创建第二个布尔条件
crit_b1 = movie.imdb_score < 5
crit_b2 = movie.content_rating == 'R'
crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)
final_crit_b = crit_b1 & crit_b2 & crit_b3

#将两个条件用或运算合并起来
final_crit_all = final_crit_a | final_crit_b

#使用loc,对指定的列做过滤操作，可以清楚地看到过滤是否起作用
cols = ['imdb_score','content_rating','title_year']
movie_filtered = movie.loc[final_crit_all,cols]
print(movie_filtered.head(10))

运行结果：

Python基础学习教程：Pandas知识点汇总2——布尔索引

更多的Python基础学习教程我也会继续为大家更新，感谢大家一直以来的支持，不懂的地方可以留言哈，整理了一套Python视频教程，有需要的伙伴，也可以发消息！

千锋python和唐唐

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。