df.select_dtypes(include=none, exclude=none)
- 选择所有的numeric types, 用 np.number or number
- 选择所有的string,用object type
- 选择datetimes, 用datetime or datetime64
- 选择timedeltas,用timedelta
- 选择pandas categorical type, 用‘category’ ??
ex:
df.select_dtypes(include=[‘object’])
这里选出的都是dataframe里 string类型的列
~ 在python里表示相反,有点类似于sql里的!=
在DataFrame里选择一些行,可以用~从True里得到False
dropna:删除有null值的行记录
dropna(subset=[‘xx’,‘xxx’]):在xx和xxx列里找有空值得记录, 并删除
Python-utils
- 它是一个集成了很多python函数和常用或可以复用的类的工具包。
- 我们创建代码时,对于可以复用的函数或类也可以放在utils里随着主代码一起调用
df.empty: 返回True,如果dataframe是空的话,反之返回False
Counter(): 在python 3里是用来对需要数的数值进行映射
ex:
c = Counter() # 创建一个新的空counter
c = Counter(‘abcasdf’) # 一个迭代对象生成的counter
c = Counter({‘red’: 4, ‘yello’: 2}) # 一个映射生成的counter
c = Counter(cats=2, dogs=5) # 关键字参数生成的counter
counter 生成counter, 虽然这里并没有什么用from collections import Counter
c = Counter(‘abcasd’)
c
Counter({‘a’: 2, ‘c’: 1, ‘b’: 1, ‘s’: 1, ‘d’: 1})c2 = Counter©
c2
Counter({‘a’: 2, ‘c’: 1, ‘b’: 1, ‘s’: 1, ‘d’: 1})