这不是教程,这是个人总结,没有阅读体验。
basic
- series可以用list创建,而且series其实就是给ndarray对象加上一层索引。所以在元素替换的时候可以等于list。
- 注意:即使指定了索引,仍然可以用0,1,2,3..作为索引获取数据。但是不规范,应该使用loc和iloc.
- 注意:切片时不是数字的索引包含结尾。
- 指定name便于合并到dataframe
- 查看dtype,修改astype
- values获取到值。
- to_list相对于values/to_numpy的不好之处在于不再能使用numpy的array的方法了.比如s.values.nonzero()查看非零元素。
- s.repeat()和s.reset_index和s.index方便构造新的series。
- 注意:series只有一列,不像dataframe那样,存在set_index,所以直接设置index即可。
- series和dict很像,也有迭代模式。s.items(),s.keys().转为字典用s.to_dict()
- 注意s.count()是不把空值计算在内的,查看元素个数s.size,查看非空元素个数s.count()。
- 在pandas的函数中要特别注意对空值的处理和是否本地化改变数据。比如groupby就会: