- 博客(16)
- 收藏
- 关注
原创 莫烦强化学习科普视频注解1:Q-learning
这篇文章是对莫烦python强化学习科普的注解因为那个视频:什么是 Q Learning (Reinforcement Learning 强化学习)_哔哩哔哩_bilibili我是真的看不懂,于是去查CSDN一,Q学习Q学习是强化学习的经典算法,伪代码如下:但是吧,我相信像我这样对于英文不好又对算法不太熟悉的人第一眼看这个伪代码是一脸懵逼的我一直相信图形语言是比文字语言更加易懂的,所以我根据算法画了个方块图:简单地说就是行动决策靠Q表,得到反馈靠环境,修正Q表..
2022-04-05 12:53:17 2026 1
原创 多层神经网络的两个定理(如何用感知机解决线性不可分问题)
一、非线性函数1.定理定理1:如果层与层之间不加非线性函数,多层神经网络将会退化到一个神经元的感知器模型状态2.证明以一个简单的二层神经网络为例:其中:输入输出的关系为:其中待求的参数:如果不加线性函数,列出输入输出关系:再看一看单个神经元(感知机)的输入输出关系:是不是有点像,我再弄得明显一点:现在。。一模一样了吧,哈哈所以就有了上面的定理二、带有阶跃函数的神经网络1.定理定理2:如果非线性函数采用...
2021-09-28 21:43:53 2392
原创 感知机算法(线性可分情况)
一、神经元MP模型数学描述:(函数形式+向量形式)二、问题描述假设在一个P维向量空间中有N个向量(样本)。这N个向量每一个都属于C1和C2两类中的一类。我们的任务就是去寻找一个超平面将两类向量完全分开。在本文中,只讨论线性可分的情况。并且很容易看出,这个问题和支持向量机所面临的问题完全一致三、感知器算法的描述与可行性1.问题数学化:在Frank Rosenblatt 1956年的理论中,问题描述为:问题可以转化为用机器学习的方法自动获得权重w和偏置b,...
2021-09-27 22:38:43 1699 1
原创 机器学习笔记(三)模型的评估方法
对于一个机器学习问题,我们有一个包含很多个数据的数据集。最为理想的情况,我们直接像炖一锅粥一样把数据通通塞给模型训练,什么也不用管,练就完了,奥里给!!练完之后你高兴地把数据放入模型中测试一下发现效果好得甚至能让人留下感动的泪水,然后你高高兴兴地就可以把这个模型拿去解决你要解决的问题。如果你是个员工,正当你准备向老板提出升职加薪,内心中期待着老板能给你一个大惊喜的时候,老板也许会送你一个更大的惊喜——无限期休假(也就是开除)。因为你这样做,很大可能你做出的学习器仅仅对你的数据集效果很好,然而对其他的数据..
2021-08-11 23:19:25 1703 1
原创 机器学习笔记(二)学习方法、误差与泛化能力
一、方法所有的统计学习(机器学习)的方法都是由:模型、策略和算法构成其中,非监督学习、强化学习同样有三要素,但此处仅说监督学习(一)模型:所需要进行学习(训练)的模型类别,也就是确定假设空间在监督学习中,这一要素即为所需要学习的条件概率分布或决策函数其中,假设空间(斜体F)通常是由一个参数向量决定的函数簇假设空间可能是有限集,但一般有无穷多个模型所有参数向量取值组成的集合称为参数空间(二)策略:(最优化问题)学习的过程就是从模型当中选择一个最优模型的过程,也就..
2021-07-18 15:08:43 1608
原创 我的机器学习笔记(一)机器学习的概念
(目录)零、引言我希望我的笔记能像《明朝那些事儿》一样,通俗易懂,引人入胜。虽然对于我这个菜鸡来说太难了,但算是多了个努力方向,应该是一件好事。废话不多说,我开始了,希望未来回过来复习的我能够看了这篇笔记后能够迅速进入状态。本笔记的主要参考资料是周志华的《机器学习》和李航的《统计学习方法》以及网上的一些资料,我不会每一个概念都照搬定义,我喜欢增加一些自己的理解,但对于重点,我会加粗一、机器学习的定义(什么是机器学习)对于这个问题,先稍安勿躁,因为机器学习并不仅仅是赋予机器(其实也就是计算
2021-07-14 22:12:26 812 1
原创 几个指针的小练习
一、指针字符串数组输出输入:一个指针字符串数组输出:输出全部字符串其中包含着字符串输出的常见算法,即while寻找休止符‘\0’,否则不断输出字符,最终将字符串全部输出。代码:#include<stdio.h>#include<stdlib.h>int main() { char* p[] = { "one","two","three","four" }; //需要操作的数组 int i;
2021-07-04 20:19:39 295
原创 动态内存学习笔记
一、内存映像计算机运行一个程序前,操作系统先将硬盘里的可执行程序代码装载到计算机的内存中,然后运行内存中的程序。装载后程序在运行的过程中会占据内存中的一块区域,等到程序(代码)执行完毕,操作系统会将该区域自动释放作为任意调遣的空闲空间。此片由硬盘调出,装载到内存的区域即为内存映像。内存映像分区:内存映像按照功能可以分为三个区域:(三个区域可能并非如图所示的连续分布)(1)代码(程序)区:存放可执行的程序指令。(2)静态存储区:存放永久(静态全局)数据区域。分为常量区和静态变量
2021-07-02 23:03:27 88
原创 字符指针笔记
字符指针可以像普通指针一样快速访问和处理字符,但字符较于其他类型相对复杂,需要理清一下关系。一、字符、字符数组、字符串和字符指针1.字符、字符数组和字符串的关系字符数组末尾有了休止符就是字符串,两者的类型是完全相同的,只是在占用内存(休止符占用一个字符的内存)输出的时候字符数组名内容是首位地址即为若有char buf[n];,则buf==buf[0]。字符数组就是字符组成的数组,用地址顺序组织字符,关系如下图:2.三者和字符指针的关系之前的时候我有个误区,当字符指针指向字符数组或
2021-07-01 17:20:18 154
原创 二重指针学习笔记
二重指针即为指向指针的指针:定义:如果在一个指针变量中存放的是另一个指针变量的地址,称该指针为指向指针的指针,即二重指针。1.需要专门的定义格式,不能直接将地址赋给同类指针int**p;int*p不完全是同一个类型2.注意指针变量和常量tips:符合模式,符合模式关掉后可以解放许多代码****二重指针练习代码:#include<stdio.h>#include<stdlib.h>int main() { int b; printf("二
2021-06-30 10:53:32 149
原创 指针与结构体
一、结构体指针#include<stdio.h>#include<stdlib.h>#include<string.h>struct info { //定义结构体 short num; char name[5];};int main() { struct info my1, my2, * p1, * p2;
2021-06-29 22:33:01 131
原创 指针和数组
一、指针和一维数组数组和指针大致是你中有我我中有你的关系: 指针 数组名 类别 (指针)变量 (指针)常量 内容 (赋予)地址 数组首地址 赋值 可赋值 不可赋值 运算 可地址运算 仅作参数 字节数 取决于基类型(sizeof(int)=4) 实例:用五种访问方式求和数组输入:数组a输出:求和sum方法大致总结为:(1)(改变赋值)(2)偏移(不改变赋值)(3)下标 (不改变赋值)代
2021-06-29 03:21:53 212
原创 C语言(三)
一、字符、字符数组和字符串字符组成的数组叫字符数组;末尾带有结束符号\0的字符数组叫字符串。二、指针1.指针类型:指针变量和其他变量一起定义,有数据类型,决定运算时候移动的步长,基本字节数即为其数据类型字节数。同时编译器决定‘不同类型指针’‘指针和指针之间’不能计算,否则需要强转强转:(强转时,指针类型没有改变,变得是地址指针常量)char* h; //字符类指针 int c = 10; ...
2021-06-27 20:23:37 92
原创 数组和结构体训练
一、结构体以及注意点结构体的定义:结构体的初始化和赋值(使用):注意点:1.结构体类型明不能与其他变量相同,但结构体成员名可以2.定义关键字struct以及分号;3.初始化方式和数组类似,但相同类型结构体可以相互赋值二、倍数标记法找质数一维数组的一个应用,这里不再过多描述其他找质数方法。本方法的原理即动态规划即利用数组的存储特性利用之前的计算结果,来简化后续的计算。输入:固定范围自然数(这里取1-100)输出:范围内所有的质数代码:(伪代码先不写了,.
2021-06-26 22:53:22 159
原创 C语言的简单字符识别与二维数组
写这篇的目的是巩固一下二维数组和字符串的学习。一、二维数组1.多维数组的定义2.二维(多维)数组的存储方式上一级的每个存储单元均为下一级一维数组的首位地址,层级之间由指针相连,只有底层才存储数据。例如三维A[3][4][4]A值为A[0]地址A[i]值为A[i][0]地址A[i][j][k]的值才是存储数据的区域3.二维数组初始化数组包括二维数组的初始化的原则存在确定行数和列数的最小约束条件。可以是下标的方式,也可以是括号的方式,但必须能够确定行数和列数...
2021-06-25 20:49:36 793
原创 C语言找到学生成绩最高分(一维数组)
这是练习使用一维数组的一个小程序,笔者编程菜鸡,只能先写个这个了,因为笔者在写这个程序之前连一维数组都不会用。 1.一维数组:(数组名称由num代替) 现在假如你定义了yi个数组num[N] (1)数组的定义方式: 第一部分:num,变量值为num的num[0]地址 第二部分:num[0~N-1],每个数组由num[0]开始,值就是数组的元素 (2)数组的存储...
2021-06-25 06:25:38 6462 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人