成员资格 isin()
isin 方法用于判断矢量化集合的成员资格,可用于选取 Series 中或者 DataFrame 中列中数据的子集。
import pandas as pd
info_man = pd.read_csv("F:/人工智能/科学计算库/files/user_info_man.csv", sep="::", engine="python", encoding="utf-8", header=None)
print(info_man[6])
print("=====================================")
# 获取职业为“学生”、“计算机/IT”、“护士” 的信息
# 方式一:
info_man[(info_man[6] == "学生") | (info_man[6] == "计算机/IT") | (info_man[6] == "护士") ]
# 方案二:
profession_list = ["学生", "计算机/IT", "护士"]
info_man[info_man[6].isin(profession_list)]
# 运行结果:
0 计算机/IT
1 自由职业者
2 财务/会计
3 其他行业
4 金融/投资
...
10821 学生
10822 教师
10823 企业高管
10824 待业中
10825 其他行业
Name: 6, Length: 10826, dtype: object
=====================================
0 1 2 3 4 5 6 7 8 9 10 11 12
0 NaN 北京 35649345 liangxing625 男 专科 计算机/IT 未婚 巨蟹座 2000~3000 168 75 http://yuehui2.nos.netease.com/33/45/93/bd107d...
8 NaN 北京 38425652 xxp 男 本科 计算机/IT 未婚 狮子座 10000~20000 183 68 http://yuehui1.nos.netease.com/20/52/56/f7b2a3...
21 NaN 北京 34375285 逗你玩 男 本科 计算机/IT 未婚 金牛座 保密 175 65 http://yuehui2.nos.netease.com/37/85/52/d452e1...
27 NaN 北京 700679902 HOLLER 男 本科 学生 未婚 金牛座 2000~3000 188 75 http://yuehui1.nos.netease.com/46/2/99/733a5f3...
28 NaN 北京 37529746 风暴 男 本科 计算机/IT 未婚 天蝎座 20000~50000 173 65 http://yuehui1.nos.netease.com/34/46/97/bd403a...
... ... ... ... ... ... ... ... ... ... ... ... ... ...
10804 NaN 台湾 6138557 ... 男 本科 学生 未婚 摩羯座 3000~5000 100 100 http://yuehui1.nos.netease.com/images/portrait...
10805 NaN 台湾 10011625 ..... 男 专科 学生 未婚 摩羯座 保密 168 55 http://yuehui1.nos.netease.com/images/portrait...
10814 NaN 台湾 9027564 小 Y 男 博士 学生 未婚 狮子座 保密 230 170 http://yuehui1.nos.netease.com/images/portrait...
10820 NaN 台湾 7135251 不存在 男 本科 学生 未婚 摩羯座 保密 155 70 http://yuehui1.nos.netease.com/images/portrait...
10821 NaN 台湾 10981393 小宇 男 本科 学生 未婚 天秤座 3000~5000 180 65 http://yuehui1.nos.netease.com/images/portrait...
2542 rows × 13 columns