自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 集成学习机器学习基础3学习笔记

作业解答回归和分类回归问题中因变量是连续变量,需要预测的数是一个连续的实数,比如人口数预测中下一年的人口数量。分类问题中因变量是离散变量,比如鸢尾花的类别,是否患病等。面对分类问题很容易想到的方法是设置一个阈值,使用回归模型求出值后高于阈值为正类,低于阈值为负类。但是阈值设置很大程度上影响结果,如果得出结果值域在[0,20]但阈值设置为0.5那么这样设置是不合理的,同时多分类情况下用阈值就不合适了。逻辑回归就是将结果转化至[0,1]上,将结果转化成各类的概率分类问题的损失函数回归问题中我们

2021-09-26 20:56:00 77

原创 集成学习机器学习基础2学习笔记

作业解答1.偏差和方差偏差是选择描述问题的模型带来的,选择不同的模型和不同的参数会带来偏差的大小不同,即为了选择一个简单的模型去估计真实函数所带入的误差。偏差度量了学习算法的期望预测与真实结果的偏离程度,即刻画了学习算法本身的拟合能力。比如对一个人口增长趋势的一个预测,采用线性回归模型和多项式回归带来的误差的大小,这是来自偏差,是模型本身复杂性决定的。方差是因为抽样带来的数据集本身的不稳定性,实际上是描述数据集本身的量,比如从一批灯泡里抽样1000个进行质检,如果抽检几次1000个灯泡结果差距很大,

2021-09-24 02:44:48 94

原创 集成学习-机器学习基础笔记

作业解答线性回归的最小二乘表达:假设自变量和因变量满足线性关系y=wTxy=w^Txy=wTx,则采用此模型预测值与真实值的差值为wTxi−yiw^Tx_i-y_iwTxi​−yi​,因为这样每一项相加不能反应真实的偏离水平,加上计算方便,所以采用L2范数:L(w)=∑i=1N∣∣wTxi−yi∣∣22=(wTXT−YT)(wTXT−YT)TL(w)=\sum_{i=1}^N ||w^Tx_i-y_i||^2_2=(w^TX^T-Y^T)(w^TX^T-Y^T)^TL(w)=i=1∑N​∣∣w

2021-09-20 00:41:26 305

原创 集成学习-机器学习数学基础笔记

集成学习 机器学习数学基础高数线代概率论高数概率论线代随机过程马尔可夫过程阶段一作业:高数线代概率论高数常用的梯度下降算法(gradient decent)不可缺少高数中梯度的概念:梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为该梯度的模)gradf(x,y)=∇????(????,????)=∂????∂????,∂????∂????=????x(????,????)????+????y(????,

2021-09-16 14:05:07 133

原创 动手学数据分析第二章笔记2

动手学深度学习第二章第二节数据合并pandas.mergepandas.concatcombine_first()数据聚合数据合并pandas常用的数据合并的方法:pandas.merge可根据一个或多个键将不同DataFrame中的行连接起来,就是数据库的join操作。pandas.concat可以沿着一条轴将多个对象堆叠到一起实例方法combine_first可以将重复数据拼接在一起,用一个对象中的值填充另一个对象中的缺失值。pandas.mergemerge是数据库风格的合并操作,常

2021-08-21 15:52:36 93

原创 动手学数据分析第二章学习笔记

动手学深度学习第二章第一节 数据清洗及特征处理查看数据集中缺失值数据集中缺失值的处理数据集中重复值的处理特征观察与处理第一节 数据清洗及特征处理查看数据集中缺失值用isnull()或者isna(),或者用info()可以查看数据集中非空数据个数这里有一些坑:numpy中的np.nan是float格式,并且不能判断两个np.nan数相等None是NoneType,np.nan is None的结果也会是Falsenumpy模块的isnan方法仅支持对数值进行判断,因此传入的如果是字符串类型会报

2021-08-19 15:53:42 172

原创 动手学数据分析第一章学习总结

动手学数据分析第一章第一节 数据载入及初步观察载入数据初步观察和保存数据第二节 pandas基础第三节 探索性数据分析第一节 数据载入及初步观察载入数据任务一:导入pandas和numpy库,没什么好写的,百度20分钟不会的基本告别数据分析了任务二:载入数据,这个地方经常会有坑,我之前在用pandas的时候也踩过,这里系统写一下:首先介绍两个简单的概念,相对路径和绝对路径,绝对路径:就是你的文件或目录在硬盘上的真正的路径例如“bg.jpg”这个图片是存放在硬盘的“E:\img”目录下,那么 “

2021-08-17 15:44:27 202

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除