Datawhale学习
文章平均质量分 70
glaxy1029
这个作者很懒,什么都没留下…
展开
-
1.机器学习绪论
基本术语属性:反映事件或对象在某一方面的表现或性质的事项,比如:人是一个属性,因为人有黄种人,黑种人,或白种人。属性也叫特征。特征向量:将属性作为坐标轴,形成多维坐标系,坐标系里的每一个点对应的坐标向量称之为特征向量。机器学习的目标就是通过一些训练样本总结出相对应的数学模型,数据越多,训练的模型精度则越高。归纳偏好:机器学习算法在学习过程中对某类型假设的某种偏好,就像投票一样,加入自己的判断因素来决定自己该投哪一票模型评估与选择经验误差与过拟合:预测输出与真实结果之间的差异成为误差,在新样本原创 2021-08-18 00:27:34 · 185 阅读 · 0 评论 -
Day08:统计相关
次序统计计算最小值numpy.amin(a,[ axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue,where=np._NoValue])计算最大值numpy.amax(a,[ axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue,where=np._NoValue])a:array,输入的数组。axis:默认值为0,限制数组行最小还是列最小ke.原创 2020-11-27 23:50:01 · 154 阅读 · 0 评论 -
Day07:随机抽样
numpy.random 模块对 Python 内置的 random 进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数,如正态分布、泊松分布等。numpy.random.seed(seed=None)seed() 用于指定随机数生成时所用算法开始的整数值,如果使用相同的 seed() 值,则每次生成的随机数都相同,如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异而不同。在对数据进行预处理时,经常加入新的操作或改变处理策略,此时如果伴随着随机操作,最好还是指.原创 2020-11-25 23:44:44 · 352 阅读 · 0 评论 -
Day06:Numpy的输入和输出
numpy的二进制文件save() 、 savez() 和 load() 函数以 numpy 专用的二进制类型(npy、npz)保存和读取数据,这三个函数会自动处理ndim、dtype、shape等信息,使用它们读写数组非常方便,但是 save() 输出的文件很难与其它语言编写的程序兼容。**npy格式:**以二进制的方式存储文件,在二进制文件第一行以文本形式保存了数据的元信息(ndim, dtype,shape等),可以用二进制工具查看内容。**npz格式:**以压缩打包的方式存储文件,可以用压.原创 2020-11-23 23:27:58 · 119 阅读 · 0 评论 -
Day02:Numpy数组的索引与切片
有一些树上也分为三种索引方式:基本切片索引,花式索引和查找索引。数据的索引与查找(切片索引,花式索引,查找索引)可以对比学习一下。现在我们来讲讲今天的主要内容。- 整数索引整数索引就是对数组中的单个元素进行操作import numpy as npx=np.array([1,2,3,4,5,6,7,8,9])#创建一个数组print(x[3])#第四个元素,这里[]内的数是数组的下标。#4- 切片索引切片操作是指抽取数组的一部分元素生成新数组。对 python 列表进行切片操作得到.原创 2020-10-23 21:58:54 · 541 阅读 · 2 评论 -
Day01:Numpy数组,Python列表的差异与Numpy数组元素的访问
1.在处理多维数组方面:Python和numpy都可以用于处理多维数组,但两者的存储效率和输入输出性能有着较大的区别。Numpy专门针对数组的操作和运算进行了设计,在存储效率和输入输出性能方面远远的优于Python的嵌套列表,数组越大,Numpy的优势也就越加的明显。2.在元素的数据类型方面:Numpy数组中所有的元素的类型必须相同,而Python中嵌套列表的元素数据类型可以是任意的,另一方面Python的float类型在数据过大的时候不会产生数据的溢出,所以他的通用性能要比Numpy优越,但在科学计原创 2020-10-20 23:02:13 · 344 阅读 · 3 评论 -
Day05:Numpy排序搜索计数
排序numpy.sort(a[, axis=-1, kind=‘quicksort’, order=None])返回数组的排序副本。(a.axis:排序沿数组的(轴)方向,0表示按行,1表示按列,None表示展开来排序,默认为-1,表示沿最后的轴排序。b.kind:排序的算法,提供了快排’quicksort’、混排’mergesort’、堆排’heapsort’, 默认为‘quicksort’。c.order:排序的字段名,可指定字段排序,默认为None。)numpy.argsort(a[, .原创 2020-10-30 23:52:07 · 178 阅读 · 0 评论 -
Day04:Numpy函数
数学函数numpy.add(x1, x2, *args, **kwargs) 按元素添加参数。numpy.subtract(x1, x2, *args, **kwargs)按元素减去参数。numpy.multiply(x1, x2, *args, **kwargs) 按元素乘以参数。numpy.divide(x1, x2, *args, **kwargs) 返回输入的真实除法,按元素划分。numpy.floor_divide(x1, x2, *args, **kwargs) 返回小于或等于输入.原创 2020-10-28 23:28:30 · 762 阅读 · 0 评论 -
Day03:Numpy数组的操作
先补充一下数组的迭代,利用apply_along_axis(func, axis, arr)对数组进行操作,func是自定义函数,axis表示函数func对arr是作用于行还是列。下面开始今天的内容更改形状numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即ndim属性(秩(数组的维数)),一般的数组秩为2。这里介绍一下数组的秩:在Numpy中,每一个线性的数组称为是一个轴(axes),秩其实是描述轴的数量。举个栗子哈,二维数组相当于是两个一维数组,.原创 2020-10-25 22:08:09 · 627 阅读 · 0 评论