![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 61
想要回到家乡的计算机爱好者
从现在到研究生结束,我要写够1000篇技术总结,逢学必写
展开
-
决策树的概念和构建
构建的二叉树尽量均衡就像一个班60个人的实力都差不多,现在要选一个人去拯救世界,就确定不了,但是一个班有一个人能力特别特出,选这个人去拯救世界的概率就比较大,就比前面的情况更有确定性最大的那个值就算均匀分布时候的那个值原创 2024-06-05 00:37:00 · 415 阅读 · 0 评论 -
朴素贝叶斯
那个不太懂的点其实是Dodo讲错了,那里还是累乘的符号,然后64种情况累乘起来就是P(X=x),这是固定的,假设为C。P(Y=CK)这是按照训练集0~9的个数来计算的,注意维度的区别,有些是像素维度,有些是图片维度。注意之前我们讲的数据集是8*8的矩阵,然后我们处理矩阵的方式就是讲矩阵排列成一行。我们假设这个像素点的出现是相互独立的(在现实中并不是相互独立的)如果训练集中没有0,那么P(Y=CK)=0,就不能当分母了。注意P(B)=1, 已经知道路人抽中的就是绿豆。在X的条件下分别等于0~9的概率。原创 2024-05-26 23:41:11 · 408 阅读 · 0 评论 -
k近邻和kd树
前提是已经有了一棵kd树,然后来一个实例点。采用树这个特殊的数据结构来实现k近邻算法。选取k值的时候可以采用交叉验证的方法。找这个中位数是按照每棵子树来创建的。下面讲解kd树的完整构造过程。原创 2024-05-24 16:18:25 · 302 阅读 · 0 评论 -
感知机代码
这段代码主要是判断给的图片是不是0-9之间的数据,不可细分0-9。相当于是28*28=784维度的空间,然后训练w。tqdm可以显示进度条。原创 2024-05-14 22:31:32 · 111 阅读 · 0 评论 -
感知机导论
感知机也可以多分类,把多个感知机模型结合起来方便统一形式,规定一下后面的格式规定这种格式主要目的是为了简洁推导和方便coding最后一个式子是我们想办法要推导的k≤Rγ2k≤γR2∣∣wopt∣∣1∣∣wopt∣∣1表示这是几何距离,这是单位法向量.统一了单位存在γ0yiwopt∗xibopt≥γ\gamma>0,\;原创 2024-05-08 11:40:04 · 300 阅读 · 0 评论 -
统计学习方法-导论
就像一个小学生不做作业,然后被爸爸打了,然后小学生就知道做作业了,因为赌博还没有被爸爸打,所以小学生以为赌博是对的,就去赌博,然后又被爸爸打了,小学生才知道不能赌博无监督模型后面没有label(是否招女孩子喜欢)对于监督学习而言呢,从数学形式来讲,主要分两种,我们首先看一下训练集呢,我一般是这样表述的,这个T就代表训练集去圈你。training data, x1就表示这条样本,y就表示是否招女孩子喜欢,比如说这个x(x(1),x(2)…)就是我们之前的体重,身高,年龄对于每一个x呢,它其实是有很多维度的,它原创 2024-05-06 00:55:10 · 570 阅读 · 1 评论 -
anaconda的安装和Jupyter Notebook修改默认路径
c.NotebookApp.notebook_dir = //这个不是搜索出来的,是要自己加上去的一条。然后不能在开始菜单中通过快捷方式打开,这个打开那个路径不生效,自己也不知道什么原因。要是没有配置这个环境变量,后面就不能cmd启动Jupyter Notebook。按照那个标志打开,那个文件的属性是没有网上说的那个属性的。我们要找到Jupyter Notebook的配置文件。很多文章都比较老旧了,这个问题一个是新版本才有的。就可以找到存放配置文件的路径了。只能通过管理员模式的cmd打开。原创 2024-04-30 19:43:04 · 442 阅读 · 0 评论