今天在处理数据的时候,碰到一个问题:有一个dataframe,有一个list,想要达到的效果是提取dataframe中某一列中含有list中任何一个子字符串的数据,通过查询资料找到了如下方法:
一、join()函数的用法
语法: ‘sep’.join(seq)
参数说明
sep:分隔符。可以为空
seq:要连接的元素序列、字符串、元组、字典
上面的语法即:以sep作为分隔符,将seq所有的元素合并成一个新的字符串
返回值:返回一个以分隔符sep连接各个元素后生成的字符串
二、结合series.str.contains()使用筛选数据
使用语句 df[series.str.contains(’|’.join(list))] 即可
df:原始的dataframe
series:需要筛选的列
list:包含需要筛选的字符串的列表