自己使用 numpy, pandas, matplotlib 时踩过的坑
numpy.sum()计算元素出现次数
众所周知,Numpy的sum()方法除了能求和,还能计算元素出现次数,但是目的为后者时,接收对象须为array对象
a = ['外观', '外观', '你好', '1', '1']
print(np.sum(a == '1')) # 输出为0
a = np.array(a)
print(np.sum(a == '1')) # 输出为2
# 除此之外,也能直调用collections模块对数组计数
import collections
collections.Counter(['外观', '外观', '你好', '1', '1']) # 结果为2
pandas 读取或者选择某几列
df.loc[:, 1:] # 错误
# 方法一
df = pd.DataFrame(df, columns=['a', 'b']
# 方法二
df[['a', 'b']]
# 方法三
df.loc[:, ['a', 'b']]
# 方法四
df.loc[:, 1:]
不同维度array的广播
解决方法:
a = a = mean[:, np.newaxis]
# np.newaxis的作用就是选取部分的数据增加一个维度
可变参数和关键字参数(*args **kw)
Python语法中,当*参数 (可变)和 **参数(关键字) 同时出现在函数定义的参数列表中时,说明参数列表可接受任意数量的参数,它们都统称为可变参数。
-
函数定义时
1、*args表示可接受任意个(包含0个)位置参数,当函数调用时,所有未使用(未匹配)