机器学习
Em_dark
这个作者很懒,什么都没留下…
展开
-
机器学习系列笔记(七)
The VC dimension 定义VC维度 VC维度感知 VC维度的物理直觉 解读VC维度Mh(N) 有break point 好的hypotheses N 够大 好的data 挑选一个演算法让Ein 最小 那么就可以说是学到了东西The VC dimension是最大的break point dvc=’minimum k’-1 i原创 2017-11-09 11:16:33 · 222 阅读 · 0 评论 -
Anaconda初探
Anaconda 是什么? 实际上它是一个包和环境管理器,它附带了 conda、Python 和 150 多个科学包及其依赖项,一般的大小大概500M,因为它附带了python最常用的数据包,如果需要节省空间和带宽,可以选择小的Miniconda这个版本,只包含conda和python. conda只能通过命令行来使用 如果你还没有学习过命令行你可以参照下面两个连接去学习 window ht原创 2018-01-23 10:28:31 · 2219 阅读 · 0 评论 -
机器学习系列笔记(八)
杂讯与错误 noise and error 不同错误适用于不同的场景 false accpet 错误接受 false reject 错误拒绝商场打折 FBI门禁各种情况下有不同的权重 weighted classificationweighted pocket algorithm 权重口袋算法Linear Regression 线性回归现在的问题回到发信用卡的问题上 现在的问题不是原创 2017-11-09 11:36:14 · 284 阅读 · 0 评论 -
机器学习系列笔记(六)
泛化理论 theory of generalizationbounding function B(N,K) :上限函数B(N,3) break point 在3上shatter 出现所有状况dichotomies有2个点 不能有2个break point ,shatter 有三种情况 有3个点, 不能有2个break point,shatter 有4种情况所有N个点,不能有有1个break poi原创 2017-11-03 14:49:57 · 239 阅读 · 0 评论 -
机器学习系列笔记(五)
learning 拆分为两个问题 一:我们如何可以让Ein(g)和Eout(g)足够接近? 二:如何让Ein(g)变的越来越小?M hyposesis的大小 M比较小的时候:good,p[bad<=2Mexp],bad 很少的选择 M比较大的时候:好的选择,坏事情发生的机率增加把hypotheses 分类 怎么分类 从一个Data 来看只有两种线 一种是判定它为是的线,否则反之.原创 2017-11-03 11:32:31 · 298 阅读 · 0 评论 -
机器学习系列笔记(四)
学习的可行性 学习是不可能的? 可能拯救 连接学习 连接到真实学习有多种情况解的问题.通过学习后的g怎么解释都可以, 比如说6/2(2+1)=9?1?这样的问题问一个有很多红色和绿色的弹珠,想知道红色弹珠的比例有多少sample 拿10个. 其中有多少red的那么有引伸出霍夫丁不等式 (hoeffding’s inequality) P[|v-u|>E]≤2exp(-2E²N)u是总共re原创 2017-11-02 14:35:14 · 255 阅读 · 0 评论 -
机器学习系列笔记(三)
学习的类型 是非题 (前面的银行发信用卡的例子) 2元分类的问题 more binary classification problems 信用卡发卡 垃圾邮件 判别病人是不是生病 广告收益是不是收益 答案对不对这是一类 把问题分为2类的问题 对与不对 从这里衍生 4元问题或者更多?–如何分别1分 1角 5角 一元的硬币 四种类型 可能从大小 重量来分辨? 那这里的输出 Y原创 2017-11-01 16:34:55 · 273 阅读 · 0 评论 -
机器学习系列笔记(二)
上一次的学习的回顾 我们把每个使用者x用一个向量来表示 这个x有很多个维度 在银行卡申请的案例中 x就是申请表, 那么x的维度有:年龄, 年薪,..etc. 那么我们给x所有的维度计算出一个分数, 如果这个分数超过了某个极限就发卡 就像考试, 每题都给你分数,加起来超过60就给你及格, 没超过就不及格, 如果这个题很重要,给分多一点注意到这里是小h 是可能的一个公式 那这里的thres原创 2017-11-01 14:26:41 · 253 阅读 · 0 评论 -
机器学习系列笔记(一)
学习是什么? 学习是通过大量观察得来的, 然后技能是通过大量的观察,然后学习,得来的 而机器学习就是主体变成人了. 通过机器的观察来学习(skill). 观察到的东西–>资料(data) data–>ML–>improved performers meaures 股票的大量数据–>ML–>预测更准确 机器学习的应用 分辨一颗树 定义一棵树 通过大量观察而定义一棵树用于, 不能手原创 2017-10-31 18:33:56 · 517 阅读 · 0 评论 -
Jupyter notebook初探
Jupyter notebook 是什么Jupyter notebook 是一种 Web 应用,能让用户将说明文本、数学方程、代码和可视化内容全部组合到一个易于共享的文档中。 Jupyter Notebook 已迅速成为处理数据的必备工具。其用途包括数据清理和探索、可视化、机器学习和大数据分析 (摘之百度) notebook的想法是直接在代码旁边展现描述性的文字,而不是另外起一个文档记录原创 2018-01-24 20:21:23 · 1248 阅读 · 0 评论