- 博客(5)
- 收藏
- 关注
原创 建模与预测学习笔记
建模与预测学习笔记 一.统计学习分类: 1.监督学习 利用一组带标签的数据,学习从输入到输出的映射,然后将新数据用这种关系可以得到映射结果,达到分类或者回归的目的,常用的有线性回归、决策树等. 2.非监督学习 输入数据没有被标记,也没有确定的结果,常用的有K-means聚类、层次聚类等. 3.半监督学习 在实际情况中,获取的数据大部分是无标签的,人们企图加入一些人为标注的样本,使得无标签的数据通过...
2020-04-01 21:45:02
146
原创 特征工程学习笔记
特征工程学习笔记 一. 特征工程的重要性:为了解决实际问题,通常需要收集大量的数据,这些数据未经过滤,可能非常杂乱,甚至不完整。为了更好地使用这些数据,需要对数据进行处理,这就需要用到特征工程。 特征工程是这样一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高及其学习性能。 特征工程具体包括以下几个方面: 1.转换数据的过程:这里并不特指原始数据或未过滤的数据,特征工程适用于任何阶段的数据...
2020-03-27 21:18:19
83
原创 探索性数据分析学习笔记
探索性数据分析学习笔记 探索性数据分析(EDA),也成描述性统计分析,是指对已有数据在尽量少的先验假设下通过作图、制表、计算统计量等手段探索数据的结构和规律的一种数据分析方法。传统的统计分析方法常常先假设数据符合一种统计模型,然后依据数据样本来估计模型的一些参数及统计量,以此了解数据特征,但是实际中往往有很多的数据并不符合假设的统计模型分布,这导致数据分析并不理想。EDA则是一种更加贴合实际情况的...
2020-03-24 21:32:25
405
原创 过拟合、欠拟合学习笔记
探究模型训练中经常出现的两类典型问题: 一类是欠拟合,另一类是过拟合. 1.欠拟合 模型无法得到较低的训练误差,将这一现象成为欠拟合. 2.过拟合 模型的训练误差远小于它在测试集上的误差,称这一现象为过拟合. 可能导致这两种拟合问题的因素有很多,比如模型复杂度和训练集大小. 模型复杂度 随着模型复杂度增加,训练误差波动降低,平均训练误差降低趋向于0,而测试误差波动上升,平均测试误差先降低后升高。这...
2020-02-18 21:11:18
139
原创 线性回归学习笔记
线性回归模型假设输出与输入之间是线性关系. 线性回归模型基本思路: 定义模型/初始化模型参数—前向传播/计算预测值/计算损失—反向传播/更新权值. 1.读取数据集/生成数据集 #导入相关计算包 import torch from torch import nn import numpy as np torch.manual_seed(1) print(torch.version) torch.se...
2020-02-14 18:42:46
100
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人