1、导入鸢尾属植物数据集,保持文本不变。
用到函数numpy.load(),最简单的机制就是直接在括号里写文件路径,但有些参数设置不同的值会有不用作用:
1、skiprows是指跳过前1行, 如果设置skiprows=2, 就会跳过前两行。
2、dtype:元素的数据类型如int,float,str等。
3、comment的是指, 如果行的开头为#就会跳过该行。
4、usecol[0]是指只使用第零列, unpack=True是指会把每一列当成一个向量输出, 而不是合并在一起。
5、converters参数, 这个是对数据进行预处理的参数, 我们可以先定义一个函数,这里的converters是一个字典, converters={0:add_one}表示第零列使用函数add_one来进行预处理。
下面导入鸢尾属植物数据集,保持文本不变。
2、求出鸢尾属植物萼片长度的平均值、中位数和标准差(第1列,sepallength)
这里主要运用了三个函数:1、np.mean()求均值
2、np.median()求中位数
3、np.std()求标准差
过程如下: