问题出现情景:
读取DataFrame中某一行,并进行value_counts()。
print(df['Layout'].value_counts())
打印出来的如下
2室1厅 9485
3室1厅 3999
3室2厅 2765
1室1厅 2681
2室2厅 1671
4室2厅 930
1室0厅 499
4室1厅 295
5室2厅 200
2房间1卫 170
1房间1卫 146
3房间1卫 116
......
其中包括 xx室xx厅 和 xx房间xx卫,需要将所有"xx房间xx卫"格式的数据都移除掉,只保留"xx室xx厅"的数据。
所以代码如下:
df = df.loc[df['Layout'].str.extract('^\d(.*?)\d.*?') == '室']
出现错误:
解决办法:加个expand=False
df = df.loc[df['Layout'].str.extract('^\d(.*?)\d.*?',expand=False) == '室']