机器学习
机器学习的记录
许进进
这个作者很懒,什么都没留下…
展开
-
神经网络NN算法Nerual Networks
一. 背景: 人脑中的神经网络是一个非常复杂的组织,成人的大脑中估计有1000亿个神经元之多。以人脑中的神经网络为启发,历史上出现过很多不同版本的算法,最著名的算法是1980年Rumelhar和Hinton等人提出的反向传播( Backpropagation ,BP)算法。 二. 多层向前神经网络(Multilayer Feed-Forward Neural Network) 多层向前神经网络由三部分组成:输入层(input layer), 隐原创 2020-09-30 18:30:37 · 8191 阅读 · 0 评论 -
神经网络实践一 · 利用PyTorch进行气温预测
利用NN进行简单的气温预测,数据集已上传。数据集主要字段介绍:year,moth,day,week:表示的具体的时间,因为为字符格式需要进行独热编码处理 temp_2:前天的最高温度值 temp_1:昨天的最高温度值 average:历史中每年这一天的平均最高温度 actual:标签值,表示当天的真实最高温度 friend:用不到,暂不用管原始数据维度: (348, 9), 数据: year month day week temp_2 temp_1 aver...原创 2020-08-12 11:49:00 · 10641 阅读 · 5 评论 -
svm松弛变量与惩罚因子
1.松弛变量 现在我们已经把一个本来线性不可分的文本分类问题,通过映射到高维空间而变成了线性可分的。就像下图这样: 圆形和方形的点各有成千上万个(毕竟,这就是我们训练集中文档的数量嘛,当然很大了)。现在想象我们有另一个训练集,只比原先这个训练集多了一篇文章,映射到高维空间以后(当然,也使用了相同的核函数),也就多了一个样本点,但是这个样本的位置是这样的:...转载 2018-12-31 20:43:42 · 11310 阅读 · 0 评论 -
分类性能度量指标:ROC曲线、AUC值、正确率、召回率、敏感度、特异度
在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。在机器学习中,有一个普遍适用的称为混淆矩阵(confusion matrix)的工具,它可以帮助人们更好地了解分类中的错误。比如有这样一个在房子周围可能发现的动物类型的预测,这个预测的三类问题的混淆矩阵如下表所示:利用混淆矩阵可以...转载 2018-12-31 20:46:53 · 8342 阅读 · 0 评论 -
决策树
一:什么是决策树/判定树(decision tree)? 判定树是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或类分布。树的最顶层是根结点.二 算法举例三熵(entropy)概念信息和抽象,如何度量?1948年,香农提出了 ”信息熵(entropy)“的概念 一条信息...原创 2019-07-28 23:28:19 · 5121 阅读 · 0 评论 -
机器学习
目录一 机器/深度学习简介2.1 机器学习 (Machine Learning, ML)2.1.1概念2.1.2学科定位2.1.3定义2.1.4: 学习2.2 深度学习二 基本概念2.1 基本概念2.2 有/无/半监督学习2.3机器学习步骤框架三 机器学习3.1 监督学习(Suprivised Learning)、分类(Classific...原创 2019-07-28 23:32:51 · 5241 阅读 · 0 评论