自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 机器学习笔记(三)过拟合、欠拟合与正则化

一、过拟合与欠拟合1.定义过拟合与欠拟合都是机器学习建模过程中可能遇到的问题。欠拟合指模型在训练过程中对训练集拟合效果差,一般是由于模型的复杂度过低;过拟合指模型在训练过程中对训练集拟合效果好,但在测试过程中对测试集拟合效果差,即模型的泛化能力差,一般是由于建立的模型过于复杂。2.出现原因出现欠拟合情况的原因一般是模型还未完成学习,在后续的学习过程中一般能够得到改善。出现过拟合情况的原因一般为:1.训练集数据类型单一或数据量过小2.训练数据当中噪声干扰过大3.模型过于复杂(包含了过多特征)

2022-04-13 14:56:06 960

原创 机器学习笔记 (二)Logistic回归

一、Logit函数和Sigmoid函数二、模型形式hθ(x)=11+e−θTxh_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}hθ​(x)=1+e−θTx1​其中θ=(θ0,θ1,θ2,...,θn)T\theta=(\theta_0,\theta_1,\theta_2,...,\theta_n)^Tθ=(θ0​,θ1​,θ2​,...,θn​)T,x=(1,x(1),x(2),...,x(n))Tx=(1,x^{(1)},x^{(2)},...,x^{(n)})^Tx=(

2022-04-11 16:08:51 1444

原创 机器学习笔记 (一) 线性回归

前言lz最近开始学习机器学习算法,为了防止现在学到的知识在未来一段时间慢慢遗忘,在学习途中作此纪录,方便未来回顾。本文记录的算法是线性回归算法。一、名词解读1.线性什么是线性?顾名思义,线性的意思就是数学模型的几何表现是一条直线,这是基于模型中因变量(机器学习中称为特征或属性)是一元的情况。当模型中因变量为二元(特征向量是二维)时,其在几何上的表现则是一个平面,而当模型中因变量为多元(特征向量是多维)时,其在几何上的表现是一个超平面。2.回归在有监督算法中,当因变量y是连续性变量时,需要使用回

2022-04-10 17:07:09 1004

原创 SQL窗口函数

SQL窗口函数一、窗口函数应用场景:分组处理数据二、窗口函数基本语法<窗口函数> over (partition by <用于分组的字段名> order by <用于排序的字段名>)上面代码含义为:首先将数据表根据<用于分组的字段名>分段,并且根据<用于排序的字段名>排序,而后对经过这两步处理的数据表执行<窗口函数>注:partition by与group by的区别:group by改变了表的行数,经过分组后每

2021-03-16 16:13:54 134

原创 SQL数据表的建立与修改

SQL数据表的建立与修改前言一、SQL数据表的建立1.普通建表语句2.建表时检查是否有重复表:3. 建表时从已有表格中引入数据:二、插入数据1.插入单条记录:2.插入多条记录:3.向某几个字段插入单条记录:4.插入记录时避免重复:总结前言第一次写CSDN博客,权作为数据分析学习路上的记录提示:以下是本篇文章正文内容,下面案例可供参考一、SQL数据表的建立1.普通建表语句CREATE TABLE <表名>(<字段名> <字段格式> <是否为空(一般.

2020-12-18 16:26:23 188

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除