- 博客(5)
- 收藏
- 关注
原创 机器学习笔记(三)过拟合、欠拟合与正则化
一、过拟合与欠拟合 1.定义 过拟合与欠拟合都是机器学习建模过程中可能遇到的问题。欠拟合指模型在训练过程中对训练集拟合效果差,一般是由于模型的复杂度过低;过拟合指模型在训练过程中对训练集拟合效果好,但在测试过程中对测试集拟合效果差,即模型的泛化能力差,一般是由于建立的模型过于复杂。 2.出现原因 出现欠拟合情况的原因一般是模型还未完成学习,在后续的学习过程中一般能够得到改善。 出现过拟合情况的原因一般为: 1.训练集数据类型单一或数据量过小 2.训练数据当中噪声干扰过大 3.模型过于复杂(包含了过多特征)
2022-04-13 14:56:06 964
原创 机器学习笔记 (二)Logistic回归
一、Logit函数和Sigmoid函数 二、模型形式 hθ(x)=11+e−θTxh_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}hθ(x)=1+e−θTx1 其中θ=(θ0,θ1,θ2,...,θn)T\theta=(\theta_0,\theta_1,\theta_2,...,\theta_n)^Tθ=(θ0,θ1,θ2,...,θn)T,x=(1,x(1),x(2),...,x(n))Tx=(1,x^{(1)},x^{(2)},...,x^{(n)})^Tx=(
2022-04-11 16:08:51 1452
原创 机器学习笔记 (一) 线性回归
前言 lz最近开始学习机器学习算法,为了防止现在学到的知识在未来一段时间慢慢遗忘,在学习途中作此纪录,方便未来回顾。 本文记录的算法是线性回归算法。 一、名词解读 1.线性 什么是线性?顾名思义,线性的意思就是数学模型的几何表现是一条直线,这是基于模型中因变量(机器学习中称为特征或属性)是一元的情况。当模型中因变量为二元(特征向量是二维)时,其在几何上的表现则是一个平面,而当模型中因变量为多元(特征向量是多维)时,其在几何上的表现是一个超平面。 2.回归 在有监督算法中,当因变量y是连续性变量时,需要使用回
2022-04-10 17:07:09 1005
原创 SQL窗口函数
SQL窗口函数 一、窗口函数应用场景:分组处理数据 二、窗口函数基本语法 <窗口函数> over (partition by <用于分组的字段名> order by <用于排序的字段名>) 上面代码含义为: 首先将数据表根据<用于分组的字段名>分段,并且根据<用于排序的字段名>排序,而后对经过这两步处理的数据表执行<窗口函数> 注:partition by与group by的区别:group by改变了表的行数,经过分组后每
2021-03-16 16:13:54 134
原创 SQL数据表的建立与修改
SQL数据表的建立与修改前言一、SQL数据表的建立1.普通建表语句2.建表时检查是否有重复表:3. 建表时从已有表格中引入数据:二、插入数据1.插入单条记录:2.插入多条记录:3.向某几个字段插入单条记录:4.插入记录时避免重复:总结 前言 第一次写CSDN博客,权作为数据分析学习路上的记录 提示:以下是本篇文章正文内容,下面案例可供参考 一、SQL数据表的建立 1.普通建表语句 CREATE TABLE <表名>( <字段名> <字段格式> <是否为空(一般.
2020-12-18 16:26:23 189
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人