适合初学者的神经网络机器学习理论到实践入门
适合初学者的神经网络机器学习理论到实践入门。说人话,有实践,有理论。
司南牧
立志让初学者跨界学编程/算法/AI机器人无障碍专注零基础教程,知乎@司南牧
展开
-
啤酒与尿布?挖掘商品之间的关联性分析(1):机器学习之Apriori算法
1. 背景一个广为流传的挖掘商品之间的关联性的故事就是“啤酒与尿布”这个故事。相传某超市通过分析顾客的账单,发现啤酒总是和尿布一起购买。通过分析,发现这是因为美国人喜欢喝啤酒,当买尿布的时候看到啤酒就顺便买了。于是就把啤酒与尿布总是放在一起卖。这样的有关联性的商品还有很多。如洋葱和土豆捆绑消费等等。将关联度高的商品放在一起促销或者捆绑消费可以提高营业额。同时电商平台也可以捆绑推荐提高成交量。而当...原创 2019-05-27 21:35:08 · 9059 阅读 · 0 评论 -
挖掘商品关联性(2): FP-growth算法
在前面我们介绍了一种简单的挖掘商品关联性算法Aporiori算法。原创 2019-05-28 11:38:47 · 2762 阅读 · 0 评论 -
适合初学者易懂的机器学习算法之k-means(k均值)Python代码实现
k-means算法中文名叫做k均值。它是一种聚类算法,这是什么意思呢?就是现在我有一堆数据,但是我知道这些数据有k个类。但是具体每一个数据点所属分类我就不知道了。此时就需要用k-means聚类算法,它可以把原先的数据分成k个部分,注意这k个部分包含的数据点的数量不一定相等的。相似的数据就聚在一起。k-means算法操作步骤1. 设定k的取值(你觉得有多少个类就设置是多少,不知道那就把点描出来你...原创 2019-05-26 14:55:09 · 1818 阅读 · 0 评论 -
通俗解释高中生能听懂的SVM本质和原理
当年SVM怎么被发明的?任何机器学习都是套一个数学模型,然后求解数学模型的待求解参数。SVM使用的是怎样的一个模型呢?。现在把我们作为一发明者,看看下面这张图。知道一个算法原理最好的方法是研究它是怎么想出来的,不然直接看公式可能马上就记住了,但是过了段时间就会忘因为没有理解。如果是下面这张图,我们怎么划分开这两组数据?最简单的方式就是用一条直线。现在我们已经发明了一种算法(事实上别人已经发明了...原创 2019-05-24 21:06:18 · 2038 阅读 · 1 评论 -
[编辑推荐|易懂]如何理解论文中的那些评估方法性能指标概念名词{召回率 ROC AUC 交叉验证} 适合初学者的神经网络 实战 理论 实践(6)
适合初学者的神经网络 实战 理论 实践(6)[易懂]如何理解论文中的那些评估方法性能指标概念名词{召回率 ROC AUC 交叉验证}作者:知乎 Ai酱首发于:知乎专栏《适合初学者的机器学习神经网络理论到实践》假设现在我们论文是要识别垃圾邮件。将邮件分类为垃圾邮件和非垃圾邮件。好了接下来通过垃圾邮件这个例子说明别人论文中常常出现的评估方法性能的概念名字是什么意思。假如我输入了...原创 2019-05-10 10:38:21 · 485 阅读 · 2 评论 -
从本质看决策树,谈谈信息熵是怎么发现的,ID3决策树Python实践实现XOR异或
本文首发于CSDN @Ai酱 的博客,转载请注明出处。任何机器学习的套路机器学习算法看起来那么多,其实套路就一个。那么多算法是背不下来的,自己知道他们怎么根据套路想出来的就可以。套路就三步:选取一种数学模型来对数据进行分类预测*。线性回归是用直线这个数学模型来划分数据。逻辑回归是用sigmoid这个函数来输出一个概率值。决策树是想用一个二叉树来对数据分类(二叉树也是一个数学模型)确...原创 2019-05-27 10:54:31 · 925 阅读 · 0 评论 -
易懂如何理解单个神经元+随机梯度下降学习逻辑与规则编程实践
易懂的神经网络Python实战:单个神经元+随机梯度下降学习逻辑与规则目录逻辑与(AND)破除神经元的认知障碍实践:用程序表示一个手工设置权重weight和偏置bias的神经元那么怎么让计算机自己确定神经元的参数?梯度下降1。直观理解梯度下降2。梯度下降怎么做的?4。梯度下降有啥用?实践:动手实现随机梯度下降(根据上面的那个伪代码)AI韬鸽的笔记专栏中《...原创 2019-04-26 16:30:31 · 12692 阅读 · 1 评论 -
适合初学者的神经网络理论到实践(2):理论结合python编程实践介绍反向传播,为何说深度学习离不开反向传播?
专栏中《零神经网络实战》系列持续更新介绍神经元怎么工作,最后使用python从0到1不调用任何依赖神经网络框架(不使用tensorflow等框架)来实现神经网络,梯度下降、反向传播、卷积神经网络CNN、循环神经网络RNN。从0基础角度进行神经网络实战。 上一篇:零基础神经网络实战(1):单个神经元+随机梯度下降学习逻辑与规则作者:@Ai酱实例介绍反向传播,为何说深度学习离不开反向传...原创 2019-04-26 16:32:59 · 808 阅读 · 0 评论 -
适合初学者的神经网络理论到实践(3): 概率统计与机器学习神经网络的联系?
欢迎关注博主或CSDN专栏《适合初学者的神经网络机器学习理论到实践入门》统计就是根据样本估计总体的概率分布。概率是已知总体概率分布,求某个样本的概率。举个高中常见的例子:什么是统计?:不知道袋子里面多少球,现在从袋子取5次球。发现4次是红,1次是白。然后我们估计这个袋子红白比例可能是4:1。这就是统计,根据抽样来估计整体的样本分布规律。什么是概率?:已知袋子有10个球,红球8个,白...原创 2019-04-26 16:34:55 · 1056 阅读 · 0 评论 -
适合初学者的神经网络理论到实践(4): 打破概念束缚:强化学习是个啥?
注意:强化学习有很多概念,不要一开始被这些概念束缚了。首先得知道强化学习大致是什么,再看这些概念就会恍然大悟。 本文的思路就是先介绍我对强化学习的理解。然后介绍强化学习中的一些概念。最后是强化学习实践。打破概念束缚:强化学习是个啥?答:强化学习就是受到动物从生活中学习技能的思想启发的一种智能算法;那么怎么启发的呢?动物学习技能的过程就是不断尝试各种行为,最后总结经验,然后以后遇到相同情...原创 2019-04-27 20:23:53 · 667 阅读 · 0 评论 -
适合初学者的强化学习教程(1): python使用gym实践和注意事项
安装 pip install gym报错 AttributeError: module 'gym.envs.box2d' has no attribute 'BipedalWalker'这是因为gym没有安装box2d的原因。pip install box2d-py如果上面这条命令出下面这个报错:error: command ‘swig.exe’ failed: No such...原创 2019-04-26 16:06:08 · 7179 阅读 · 4 评论 -
适合初学者的神经网络理论到实践(5):10分钟从实践了解Python测试入门
Table of Contents- 如何比较运行时某变量大小或类型是否与预期值一致: assert(断言)assert例子:assert练习:- Python单元测试实践- 如何测试近似相等,非常接近我们就认为是相等(需要用到numpy)为何要测试:设定预期结果让计算机判断结果是否符合预期。省得组件很多的时候一个一个的检测这些组件是否运行结果正确。- 如何比较运行时某...原创 2019-05-04 14:51:25 · 683 阅读 · 0 评论 -
如何理解Bayes贝叶斯公式|如何理解极大似然法|这两个有什么关系?贝叶斯定理是什么|贝叶斯公式在机器学习中有什么用?
如何理解贝叶斯定理|公式?贝叶斯公式到底想说啥?如何理解极大似然法|这两个有什么关系?它怎么来的?用图形表示是什么样子。贝叶斯定理是什么|贝叶斯公式在机器学习中有什么用?原创 2019-05-06 19:05:55 · 905 阅读 · 0 评论 -
如何理解无偏估计?无偏估计有什么用?什么是无偏估计?
如何理解无偏估计无偏估计:就是我认为所有样本出现的概率一样。假如有N个样本我们认为所有样本出现概率都是1/N。然后根据这个来计算数学期望。此时的数学期望就是我们平常讲的平均值。数学期望本质就是平均值无偏估计为何叫做“无偏”?它要“估计”什么?回答第二个问题,它要估计的是整体的数学期望(平均值)。那为何叫做无偏?有偏是什么?假设这个是一些样本的集合X=x1,x2,..,xi,xN...原创 2019-05-06 17:14:37 · 32351 阅读 · 9 评论 -
4分钟看懂逻辑回归是什么?要优化什么参数?和极大似然法有什么关系?机器学习小总结
机器学习虽然那么多事实上都是一个规律。我在文章末尾进行了总结。逻辑回归和线性回归最大区别两个一 是线性回归它认为模型是一条直线,逻辑回归它认为模型是一条曲线。二是优化参数的方法。线性回归就是想让各个样本点离画出来的直线的平均距离尽可能短。而逻辑回归则不是算平均距离。它是用概率来优化的。优化方法叫做极大似然法。还是不懂要优化什么参数?和怎么优化的?看下面的:那么逻辑回归里面的极大似然法怎么做的?逻辑回归到底是什么?要优化什么参数?为何要优化这些参数...原创 2019-05-27 15:29:06 · 1518 阅读 · 2 评论 -
概率质量(mass)函数和概率密度(density)函数区别
答:他们是同一个东西,不同名字。就像人类,有些叫做男人有些叫做女人,一样的道理。描述离散型数据的概率叫做概率分布函数,描述连续型数据叫做概率密度函数。概率分布函数:各个分类的概率。概率密度函数:数据落在某一段连续的区间的概率。概率分布函数概率密度函数...原创 2019-05-06 14:56:29 · 9462 阅读 · 0 评论 -
Python中numpy中tile和repeat用法和区别
tiletile(数组,重复次数)tile(数组,(第1维重复次数,第2维重复次数,...,第n维重复次数))例子tile(数组,(沿着第1维的轴重复次数,沿着第2维的轴重复次数,…,沿着第n维的轴重复次数))我看了下numpy中tile()函数的源码,它是这么做的。(第1维重复次数,第2维重复次数,...,第n维重复次数)这是个元组。这个元组维度和目标数组维度一样,因为它是要...原创 2019-05-04 15:45:19 · 850 阅读 · 0 评论 -
分类交叉熵与二元交叉熵区别?Categorical Cross-Entropy Loss, Binary Cross-Entropy Loss
有时候你用交叉熵发现损失值很低但是识别效果就是不好这可能是因为你有多个分类但是却用二元交叉熵的原因。原创 2019-08-27 19:34:01 · 3465 阅读 · 1 评论 -
在colab训练与使用运行PVNet进行估计物体的位置和姿态
为了能让colab操作google driver中的文件需要执行下面代码。!apt-get install -y -qq software-properties-common python-software-properties module-init-tools!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > ...原创 2019-09-14 22:09:51 · 548 阅读 · 1 评论