Python 常用函数
1.tile(intX, (m, n))
tile():瓷砖函数,进行复制粘贴扩展,把intX复制成m行n列
2.sum()
sum():求和,参数axis=1表示按行求和
3.argsort()
argsort():排序函数,从小到大排序,得到数据的索引的顺序
4.get()
get():字典中的get(key, default=None)函数,返回key键所对应的值,如果不存在,则返回默认值default
5.sorted()
sorted():可对所有可迭代的对象进行迭代操作,而sort是应用在list上的方法
sorted(iterable, cmp=None, key=None, reverse=False)
iterable – 可迭代对象。
cmp – 比较的函数,这个具有两个参数,参数的值都是从可迭代对象中取出,此函数必须遵守的规则为,大于则返回1,小于则返回-1,等于则返回0。
key – 主要是用来进行比较的元素,只有一个参数,具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序。
reverse – 排序规则,reverse = True 降序 , reverse = False 升序(默认)。
6.items()
items():返回一个迭代器
7.readlines()
readlines():按行读取数据
8.zeros()
zeros((m,n)):初始化一个mxn大小且元素全为0的矩阵
9.strip()
strip():用于移除字符串头尾指定的字符(默认为空格或者换行符)或字符序列,
10.split():
split():通过指定分隔符对字符串进行切片,’\t’是制表符,换行’\n;使用tab字符\t将上一步得到的整行数据分割成一个元素列表
11.append()
append(b):直接将b作为整体单一元素插入至尾部
12.extend()
extend(b):将b中的数据拆分为单个单个元素依次插入至尾部
13.min()
min(0):参数0使得函数可以从列中选取最小值,而不是选取当前行的最小值
14.max()
max(0):参数0使得函数可以从列中选取最大值,而不是选取当前行的最大值
15.normMat[numTestVecs:m, :]
normMat[numTestVecs:m, :] :numTestVecs:m 表示从m中随机选numTestVec个
16.re模块的complie()
complie(pattern[, flag]):使用 compile 函数将正则表达式的字符串形式编译为一个 Pattern 对象;pattern 是一个字符串形式的正则表达式,flag 是一个可选参数,表示匹配模式,比如忽略大小写,多行模式等。
flags 标志位参数:
re.I(re.IGNORECASE) :使匹配对大小写不敏感
re.L(re.LOCAL) :做本地化识别(locale-aware)匹配
re.M(re.MULTILINE) :多行匹配,影响 ^ 和 $
re.S(re.DOTALL) :使 . 匹配包括换行在内的所有字符
re.U(re.UNICODE):根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X(re.VERBOSE):该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。
当标点符号也被当成了词的一部分,可以使用正则表达式来切分句子,其中分隔符是除单词、数字之外的任意字符串