#本文主要争对需要处理的数据列名命名比较有规律,或者你需要提取的列的名字能够总结出某一特性
这也是我处理数据遇到的坑,搜索了半天都没有找到语句易读的处理办法。。。后来自己慢慢翻函数找的。。。
#主要语句
filter()
filter里面主要填两个参数:①函数 ②对象
最后会根据函数判断对象,返回布尔值(True or False),最终返回True的值。
#处理思路
对象——明显是dataframe含有的所有列
函数——你总结出来的需要提取的列的特性,比如列名长度、都含有某文本等
#例子
从原数据看,明显有一类是mean_new,有一类是mean。我希望提取mean_new类型的列和city列。采用反向思维简化问题:drop掉F\d{7}mean的列
#语句
m = filter(lambda x: len(x) <