weixin_42515821-CSDN博客

原创建模与预测学习笔记

建模与预测学习笔记一.统计学习分类： 1.监督学习利用一组带标签的数据，学习从输入到输出的映射，然后将新数据用这种关系可以得到映射结果，达到分类或者回归的目的，常用的有线性回归、决策树等. 2.非监督学习输入数据没有被标记，也没有确定的结果,常用的有K-means聚类、层次聚类等. 3.半监督学习在实际情况中，获取的数据大部分是无标签的，人们企图加入一些人为标注的样本，使得无标签的数据通过...

2020-04-01 21:45:02 146

特征工程学习笔记一. 特征工程的重要性：为了解决实际问题，通常需要收集大量的数据，这些数据未经过滤，可能非常杂乱，甚至不完整。为了更好地使用这些数据，需要对数据进行处理，这就需要用到特征工程。特征工程是这样一个过程：将数据转换为能更好地表示潜在问题的特征，从而提高及其学习性能。特征工程具体包括以下几个方面： 1.转换数据的过程：这里并不特指原始数据或未过滤的数据，特征工程适用于任何阶段的数据...

2020-03-27 21:18:19 83

原创探索性数据分析学习笔记

探索性数据分析学习笔记探索性数据分析（EDA），也成描述性统计分析，是指对已有数据在尽量少的先验假设下通过作图、制表、计算统计量等手段探索数据的结构和规律的一种数据分析方法。传统的统计分析方法常常先假设数据符合一种统计模型，然后依据数据样本来估计模型的一些参数及统计量，以此了解数据特征，但是实际中往往有很多的数据并不符合假设的统计模型分布，这导致数据分析并不理想。EDA则是一种更加贴合实际情况的...

2020-03-24 21:32:25 405

原创过拟合、欠拟合学习笔记

探究模型训练中经常出现的两类典型问题：一类是欠拟合，另一类是过拟合. 1.欠拟合模型无法得到较低的训练误差，将这一现象成为欠拟合. 2.过拟合模型的训练误差远小于它在测试集上的误差，称这一现象为过拟合. 可能导致这两种拟合问题的因素有很多，比如模型复杂度和训练集大小. 模型复杂度随着模型复杂度增加，训练误差波动降低，平均训练误差降低趋向于0，而测试误差波动上升，平均测试误差先降低后升高。这...

2020-02-18 21:11:18 139

原创线性回归学习笔记

线性回归模型假设输出与输入之间是线性关系. 线性回归模型基本思路：定义模型/初始化模型参数—前向传播/计算预测值/计算损失—反向传播/更新权值. 1.读取数据集/生成数据集 #导入相关计算包 import torch from torch import nn import numpy as np torch.manual_seed(1) print(torch.version) torch.se...

2020-02-14 18:42:46 100

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_42515821的博客

原创建模与预测学习笔记

原创特征工程学习笔记

原创探索性数据分析学习笔记

原创过拟合、欠拟合学习笔记

原创线性回归学习笔记

空空如也

空空如也

原创 建模与预测学习笔记

原创 特征工程学习笔记

原创 探索性数据分析学习笔记

原创 过拟合、欠拟合学习笔记

原创 线性回归学习笔记

空空如也

空空如也

原创建模与预测学习笔记

原创特征工程学习笔记

原创探索性数据分析学习笔记

原创过拟合、欠拟合学习笔记

原创线性回归学习笔记