机器学习
文章平均质量分 73
机器学习常用算法以及理解
^Mark_Zhang^
禾益桑梓,造福百川。
展开
-
神经网络梯度下降优化参数
简要描述梯度下降算法原创 2024-03-21 11:30:13 · 272 阅读 · 0 评论 -
机器学习西瓜书之决策树
为了防止模型在训练的过程中将自己的一些特征当成了所有模型都会有的特征,手动将一些分支去掉,减少分支和过拟合的操作。个人感觉这个图非常形象表示了多变量决策树,相较于单变量决策树的线性判别,多变量分类目的是实现用光滑的曲线实现分类。属性集则代表用于判断样本应该归到哪一类的判断准则,在判断西瓜的例子中就是色泽、大小这种抽象性质。后剪枝操作:用剪去一些分支作为实验,判断最后的结果,然后判断要不要剪枝。上面分析的是离散情况下的处理,但是现实生活中更多见的是连续值的处理。对于连续值,用下面公式进行划分。原创 2024-02-17 16:51:28 · 766 阅读 · 1 评论 -
机器学习西瓜书之对数几率回归
用概率论和随机过程为基本研究工具,研究广义通信系统的整个过程。常见的有无损压缩、有数据压缩等。从机器学习三要素中的“策略”角度分析,与理想分布最接近的分布就是最佳分布。信息熵(自信息的期望):信息熵越大越不确定,用数学的方式量化不确定性。相对熵(KL散度):度量两个分布的差异以及典型场景用来度量理想分布。,相对熵中的被减的部分,要使得原来的最大,就要最小化交叉熵。在概率是0.5的时候最没法确认到底数值是多少。在线性模型的基础上增加一个激活函数用于映射。原创 2024-01-23 23:56:24 · 874 阅读 · 0 评论 -
机器学习西瓜书之线性回归
目的:仅仅通过一个变量预测因变量举个例子:仅仅通过发量判断程序员水平ω。原创 2024-01-20 23:25:39 · 973 阅读 · 1 评论 -
用opencv训练自己的数据集
这里注意:1.图像要从1000开始编号,不然后续如果样本数量太少会导致没法运行。2.文件路径是要修改的路径,而且是只能出现一对引号。将上图中的所有文件复制到目标Project根目录下。代码:建议正样本像素20* 20 ,负样本80。在文件夹中创建pos和neg两个文件夹。一般正样本文件数量要比负样本文件少。在正样本文件中打开cmd。标记完以后将之前的删除。对负样本进行相同操作。原创 2023-05-15 22:52:07 · 985 阅读 · 1 评论