自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 简简单单神经网络

感知机的学习算法具体采用的是随机梯度下降法,也即是极小化过程中不是一次使整个数据集的误分类点的梯度下降,而是随机选取一个误分类点使其梯度下降。M-P神经元即接受n个输入,并给与各个输入赋予权重,然后通过计算加权和,并与自身阈(yu)值进行比较,再经过激活函数后,得到输出。从几何角度来说,给定一个线性可分的数据集,感知机的学习目标是求得能对数据集中正负样本完全正确划分的超平面。因此,神经网络既能做回归,也能做分类,而且不需要复杂的特征工程。单个M-P神经元,其激活函数为sgn函数时,也可称为感知机。

2023-09-25 17:24:13 52 1

原创 决策树基础知识与理论

决策树主要用来集成学习里,多棵决策树构成森林模型,像随机森林,在功率预测的数据处理中用的比较多。决策树可解决分类问题,也可解决回归问题。在进行数据特征划分时,一般用信息增益,即原始样本的信息熵,经过划分后形成的信息增益来区分哪一种划分方式更优。比较广泛应用的方法有ID3决策树(信息增益来衡量纯度)、C4.5决策树(增益率代替信息增益)、CART决策树(基尼指数来衡量纯度)。现有用的比较多的衡量样本纯度的方法是信息熵,信息熵是用来描述随笔变量不确定的一个度量,信息熵越小,则说明样本的纯度越高。

2023-09-22 15:14:54 59 1

原创 西瓜书3.3代码

另外一点需要注意的就是numpy的用法,怎么用numpy生成矩阵,提取列向量和行向量。最后,损失函数并没有写入代码,因为已经通过公式可计算出w,所以这里并没有用到损失函数。心得体会就是,前期一定要注意x、y、w的维数,对于后续代码编程,查问题非常有用。print("结束计算")西瓜书3.3代码,新手小白代码。# 设置迭代次数epoch。# 定义数据集内数据。

2023-09-14 20:46:33 103 1

原创 西瓜书第一二章学习体会

有个栗子比较好理解:扔骰子,每次扔的结果都是独立不相关的。详细概念是:假设样本空间服从一个未知的分布“D”,收集到的样本都是独立地从该分布中采样得到,即所谓的“独立同分布”。充分良好的数据情况下,不同算法存在适应性,测试集上效果好的,算法就好,预测出来的结果也会逼近真实。2、当标记取值为连续值时,此类任务为“回归”。1、当标记取值为离散值时,称此类任务为“分类”。记结论即可:哪个算法得到的模型在测试集上的效果好,算法就好。当学习类别只有2个时----称为二分类。数据质量很差,再怎么学习,也预测不准。

2023-09-13 11:54:20 53 1

原创 时序数据的信息熵计算

class_count[i] += 1 # i为字典的索引‘键’class_count = {} #字典,字典通过‘键’来索引。#统计每个类别的出现次数。

2023-09-12 10:44:52 149 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除