-
setdefault函数的用法及理解
dict.setdefault(key, default=None)功能:如果键不存在于字典中,将会添加该键并将default的值设为该键的默认值,如果键存在于字典中,将读出该键原来对应的值,default的值不会覆盖原来已经存在的键的值。
-
class
-
Python strip()
用于移除字符串头尾指定的字符(默认为空格)或字符序列。
注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符。
-
Python shuffle() 函数
- heapq内置模块提供基于堆的优先排序算法
- 从一个集合中查找最大最小的N个元素——Python heapq 堆数据结构
python中type dtype astype 的用法
1.type 获取数据类型
2.dtype 数组元素的类型
3.astype 修改数据类型
Pandas:
Pandas 在 0.15版引入了 Categoricals (分类)。category 类型在底层使用整数类型来表示该列的值,而不是原始值。Pandas 用一个单独的字典来映射整数值和相应的原始值之间的关系。当某一列包含的数值集有限时,这种设计是很有用的。当我们将列转换为 category dtype 时,Pandas 使用了最省空间的 int 子类型,来表示一列中所有的唯一值。
使用Category数据的一个好处就是:可以很好的节省在时间和空间的消耗
对于开始的整数类型映射,我们可以先通过reorder_categories进行重新排序,然后再使用cat.codes来实现对整数的映射
python中del删除的是变量,而不是数据。
random.seed(0)作用:使得随机数据可预测,即只要seed的值一样,后续生成的随机数都一样。
operator模块中为我们提供了大量可以用来替代代数操作符的函数.
operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号),下面看例子。
a = [1,2,3]
>>> b=operator.itemgetter(1) //定义函数b,获取对象的第1个域的值
>>> b(a)
2
>>> b=operator.itemgetter(1,0) //定义函数b,获取对象的第1个域和第0个的值
>>> b(a)
Python shuffle() 函数
shuffle() 方法将序列的所有元素随机排序。