机器学习
文章平均质量分 78
该专栏主要包括台大教授李宏毅老师的学习笔记,周志华老师喜瓜书笔记、吴恩达cs229的课程笔记以及总结的十大机器学习算法~欢迎共同学习~~~~
女王の专属领地
尼采曰:每一个不曾起舞的日子,都是对生命的辜负!
展开
-
2023春季李宏毅机器学习笔记 04 :大模型+大资料 = 神奇结果?
> 资料课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub:https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程:https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800原创 2024-01-03 23:12:09 · 447 阅读 · 0 评论 -
2023春季李宏毅机器学习笔记 06 :Diffusion Model 原理剖析
资料。原创 2024-01-04 11:09:12 · 718 阅读 · 0 评论 -
2023春季李宏毅机器学习笔记 05 :机器如何生成图像
Text Encoder将文字叙述转化为多个向量;Generation Model,输入噪音和text Encoder生成的向量,生成一个中间产物(中间产物有不同的形式)把中间产物(图中的中间产物是图片的压缩版本)输入Decoder,将图片还原为原始图像。原创 2024-01-04 11:06:30 · 1530 阅读 · 0 评论 -
2023春季李宏毅机器学习笔记 03 :机器如何生成文句
课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub:https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程:https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800原创 2024-01-03 22:01:05 · 579 阅读 · 0 评论 -
2023春季李宏毅机器学习笔记 02 :机器学习基本概念
课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub:https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程:https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800原创 2024-01-02 20:55:31 · 669 阅读 · 0 评论 -
2023春季李宏毅机器学习笔记 01 :正确认识 ChatGPT
课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub:https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程:https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800原创 2024-01-02 20:43:07 · 739 阅读 · 0 评论 -
《机器学习实战:基于Scikit-Learn和TensorFlow》
简介本书主要分为两部分:第一部分(第1~8章)涵盖机器学习的基础理论知识和基本算法,从线性回归到随机森林等,可以帮助你掌握Scikit-Learn的常用方法; 第二部份(第9~16章)探讨深度学习和常用框架TensorFlow,手把手教你使用TensorFlow搭建和训练深度神经网络,以及卷积神经网络。资源配套的源代码:https://github.com/ageron/hands...原创 2017-02-16 21:13:10 · 1645 阅读 · 0 评论 -
强化学习系列 1:强化学习入门简介
、强化学习入门简介强化学习是一种非监督学习的机器学习方法,对比监督学习,强化学习最开始并没有标好的标签,而是通过一次次在环境中尝试,获取数据和标签,然后通过学习自己总结出来的经验;一些比较有名的算法, 比如有通过行为的价值来选取特定行为的方法, 包括使用表格学习的 q learning, sarsa, 使用神经网络学习的 deep q network, Sarsa,还有直接输出行为的原创 2017-05-02 17:32:54 · 2163 阅读 · 3 评论 -
强化学习系列 2 :Q-Learning
Q-Learning决策过程:假设我们的行为准则已经学习好了, 现在我们处于状态s1, 我在写作业, 我有两个行为 a1, a2, 分别是看电视和写作业, 根据我的经验, 在这种 s1 状态下, a2 写作业 带来的潜在奖励要比 a1 看电视高, 这里的潜在奖励我们可以用一个有关于 s 和 a 的 Q 表格代替, 在我的记忆Q表格中, Q(s1, a1)=-2 要小于 Q(s1, a2)=1,...原创 2017-05-02 21:35:53 · 2117 阅读 · 1 评论 -
强化学习系列 3 : Sarsa
1、Sarsa的决策过程:Sarsa 的决策部分和 Q-learning 一模一样, 因为我们使用的是 Q 表的形式决策, 所以我们会在 Q 表中挑选值较大的动作值施加在环境中来换取奖惩. 但是不同的地方在于 Sarsa 的更新方式是不一样的.2、Sarsa 更新行为准则比如:我们会经历正在写作业的状态 s1, 然后再挑选一个带来最大潜在奖励的动作 a2, 这样我们就到达了继续写作业状...原创 2017-05-03 14:57:02 · 2235 阅读 · 3 评论 -
强化学习系列 4 : DQN
Deep Q Network.是一种融合了神经网络和 Q learning 的方法。1、神经网络传统的表格形式的强化学习有这样一个瓶颈,使用表格来存储每一个状态state, 和在这个 state 每个行为 action 所拥有的 Q 值. 如果全用表格来存储它们, 计算机内存不够, 而且搜索对应的状态也是一件很耗时的事. (比如下围棋).所以,我们可以利用神经网络将状态和动作当成神经...原创 2017-05-03 15:30:56 · 2609 阅读 · 1 评论 -
2017强化学习资料汇总
转载自:https://zhuanlan.zhihu.com/p/238078751 前言ICLR 2017中和Deep Reinforcement Learning相关的论文我这边收集了一下,一共有30篇(可能有漏),大部分来自于DeepMind和OpenAI,可见DRL依然主要由DeepMind和OpenAI把持。由于论文太多,时间有限,先把论文列出来。之后根据情况做一定分析。原创 2017-05-04 22:05:37 · 1454 阅读 · 0 评论 -
强化学习系列 5 : Policy Gradients
强化学习是一个通过奖惩来学习正确行为的机制. 家族中有很多种不一样的成员, 有学习奖惩值, 根据自己认为的高价值选行为, 比如 Q learning, Deep Q Network, 也有不通过分析奖励值, 直接输出行为的方法, 这就是今天要说的 Policy Gradients 了. 甚至我们可以为 Policy Gradients 加上一个神经网络来输出预测的动作. 对比起以值为基础的方法原创 2017-05-07 10:24:27 · 1889 阅读 · 0 评论 -
强化学习系列 6 : Actor Critic
Actor Critic Actor Critic (演员评判家), 它合并了 以值为基础 (比如 Q learning) 和 以动作概率为基础 (比如 Policy Gradients) 两类强化学习算法. Actor-Critic : Actor 的前生是 Policy Gradients , 可以在连续动作中选取合适的动作, 而 Q-learning 做这原创 2017-05-07 10:39:54 · 6724 阅读 · 2 评论 -
强化学习系列 7 : Deep Deterministic Policy Gradient (DDPG)
<7>Deep Deterministic Policy Gradient (DDPG)改进版 Deep Deterministic Policy Gradient (DDPG):将 DQN 网络加入进 Actor Critic 系统中, 这种新算法叫做 Deep Deterministic Policy Gradient, DDPG 最大的优势就是能够在连续动作上更有效地学...原创 2017-05-07 10:49:11 · 9021 阅读 · 0 评论 -
强化学习系列 8 :Asynchronous Advantage Actor-Critic(A3C)
Asynchronous Advantage Actor-Critic(A3C)A3C:有效利用计算资源, 并且能提升训练效用的算法。平行训练:A3C 其实只是这种平行方式的一种而已, 它采用的是我们之前提到的 Actor-Critic 的形式. 为了训练一对 Actor 和 Critic, 我们将它复制多份红色的, 然后同时放在不同的平行宇宙当中, 让他们各自玩各原创 2017-05-07 10:57:32 · 3732 阅读 · 0 评论 -
Q-Learning实现
1、算法: 整个算法就是一直不断更新 Q table 里的值, 然后再根据新的值来判断要在某个 state 采取怎样的 action. Qlearning 是一个 off-policy 的算法, 因为里面的 max action 让 Q table 的更新可以不基于正在经历的经验(可以是现在学习着很久以前的经验,甚至是学习他人的经验). 不过这一次的例子, 我们没有运用到 off-policy原创 2017-05-07 15:41:23 · 5751 阅读 · 5 评论 -
强化学习资料
学习资料重要相关博客:http://blog.csdn.net/dark_scope/article/details/8252969专栏:http://blog.csdn.net/column/details/deeprl.html增强学习课程 David Silver (有视频和ppt):http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teac...原创 2017-05-17 15:32:01 · 2068 阅读 · 0 评论 -
斯坦福大学cs229Andrew ng的机器学习课程
Andrew NG机器学习课程网易公开课 斯坦福大学公开课 :机器学习课程 机器学习课程教学官网:http://cs229.stanford.edu/syllabus.html Coursera最新版:https://www.coursera.org/learn/machine-learning/...原创 2017-05-17 16:53:20 · 3953 阅读 · 0 评论 -
《美团机器学习实践》思维导图
Journal of Data Acquisition and Processing:2016原创 2017-05-31 19:39:34 · 822 阅读 · 0 评论 -
《统计学习方法》的python代码实现及课件
PDF: https://github.com/QueenJuliaZxx/lihang-code代码:https://github.com/QueenJuliaZxx/statistical-learning-method https://github.com/WenDesi/lihang_book_algorithmPPT: https://github.com...原创 2017-10-24 19:48:01 · 1927 阅读 · 0 评论 -
机器视觉开源代码合集
一、特征提取Feature Extraction:SIFT [1] [Demo program][SIFT Library] [VLFeat] PCA-SIFT [2] [Project] Affine-SIFT [3] [Project] SURF [4] [OpenSURF] [Matlab Wrapper] Affine Covariant Features [5] [Ox...原创 2017-10-24 19:58:55 · 413 阅读 · 0 评论 -
机器学习十大算法---1.线性回归
1. 线性回归的模型函数和损失函数线性回归遇到的问题一般是这样的。我们有m个样本,每个样本对应于n维特征和一个结果输出,如下: 我们的问题是,对于一个新的, 他所对应的是多少呢? 如果这个问题里面的y是连续的,则是一个回归问题,否则是一个分类问题。 对于n维特征的样本数据,如果我们决定使用线性回归,那么对应的模型是这样的: 其中θi(i = 0,1,...原创 2017-10-31 16:22:29 · 1131 阅读 · 0 评论 -
机器学习十大算法---4. 决策树
算法原理决策树(Decision Tree)是一种简单但广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数有两大优点:1)决策树模型可读性好,具有描述性,有助于人工分析;2)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度学习过程一棵决策树的生成过程主要分为以下3个部分:特征选择:特征选择是指从训练数据中众多的特征中选择一个特征作为当...原创 2017-10-31 16:49:36 · 1466 阅读 · 1 评论 -
机器学习十大算法---2 .逻辑回归
逻辑回归 逻辑回归其实是一个分类算法而不是回归算法。通常是利用已知的自变量来预测一个离散型因变量的值(像二进制值0/1,是/否,真/假)。简单来说,它就是通过拟合一个逻辑函数(logit fuction)来预测一个事件发生的概率。所以它预测的是一个概率值,自然,它的输出值应该在0到1之间。此时可以看看一个博客,推导公式:http://www.cnblogs.com/daguankele/p/65...原创 2017-10-31 16:50:11 · 7058 阅读 · 0 评论 -
机器学习十大算法---3. SVM
SVM支持向量机(support vector machines,SVM)是一种二类分类模型;基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;支持向量机还包括核技巧,这使它成为实质上的非线性分类器;支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题;支持向量机的学习算法是求解凸二次规划的最优化算法;支持向量机...原创 2017-10-31 16:50:43 · 1881 阅读 · 1 评论 -
机器学习十大算法---8. 随机森林算法
在学习随机森林之前我们想你学习以下集成学习(ensemble)的内容。随机森林简介随机森林顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为那一类。在建...原创 2017-10-31 16:51:20 · 16188 阅读 · 1 评论 -
机器学习十大算法---9. 朴素贝叶斯
---------------------------------------------------------------------------------------------------------------------贝叶斯定理贝叶斯理论指事件A在事件B(发生)的条件下的概率,与事件B在事件A(发生)的条件下的概率是不一样的;朴素贝叶斯朴素贝叶斯方法是基于贝叶斯定理和特征条件独立假...原创 2017-10-31 16:51:39 · 1481 阅读 · 0 评论 -
机器学习十大算法---7. Adaboost
--基本概念:Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的弱分类器,然后把这些弱分类器集合起来,构成一个更强的最终分类器 (强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分...原创 2017-11-07 23:00:25 · 682 阅读 · 0 评论 -
机器学习十大算法---10. 马尔科夫
马尔可夫过程(Markov process)是一类随机过程。它的原始模型马尔可夫链,由俄国数学家A.A.马尔可夫于1907年提出。1、马尔可夫性:2.马尔可夫过程的数学定义若随机过程 满足马尔可夫性,则称为马尔可夫过程。 3.生成模式(Generating Patterns)3.1、确定性模式(Deterministic Patterns):确定性系统 考虑一套交通信号灯,灯的颜色变化序列依次是...原创 2017-11-07 23:06:19 · 8524 阅读 · 0 评论 -
三张图读懂机器学习:基本概念、五大流派与九种常见算法
选自PwC作者:Alan Morrison、Anand Rao机器之心编译参与:吴攀、晏奇机器学习正在进步,我们似乎正在不断接近我们心中的人工智能目标。语音识别、图像检测、机器翻译、风格迁移等技术已经在我们的实际生活中开始得到了应用,但机器学习的发展仍还在继续,甚至被认为有可能彻底改变人类文明的发展方向乃至人类自身。但你了解现在正在发生的这场变革吗?四大会计师事转载 2017-11-08 09:42:41 · 504 阅读 · 0 评论 -
机器学习之集成学习Ensemble
集成算法:将多个分类器集成起来而形成的新的分类算法。这类算法又称元算法(meta-algorithm)。最常见的集成思想有两种bagging和boosting。集成思想 :boosting:重赋权(re-weighting)--基于错误提升分类器性能,通过集中关注被已有分类器分类错误的样本,构建新分类器并集成。boosting的思想是 : 训原创 2017-11-08 10:30:04 · 2383 阅读 · 0 评论 -
机器学习十大算法之决策树---ID3算法
在决策树的每一个非叶子结点划分之前,先计算每一个属性所带来的信息增益,选择最大信息增益的属性来划。在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带来的信息越多,该特征越。象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能。的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。算法的基础就是上面提到的奥卡姆剃刀原理,越是小型的决策树越优于大的决策树,尽管如此,也不总。的,即用尽量用较少的东西做更多的事。原创 2017-11-23 14:58:07 · 3627 阅读 · 1 评论 -
「机器学习」和「深度学习」的 Cheat Sheets Helperhaps
导读:机器学习和深度学习对于新手来说是有点难度的, 深度学习类库也同样难以理解。 作者在 Github(cheatsheets-ai)上创建了一个仓库,其中提供了从不同来源收集的 Cheat Sheets。1. KerasKeras 是一个用 Python 编写的高级的神经网络 API,能够运行在 TensorFlow、CNTK 或 Theano 之上。其开发着眼于能快速实验,转载 2017-12-04 11:05:36 · 535 阅读 · 0 评论 -
机器学习【吴恩达|周志华|李宏毅|算法】清单
系列学习记录: 周志华:机器学习书籍 吴恩达 : CS229n机器学习系列 李宏毅教授:机器学习课程 绪论模型评估与选择线性模型决策树神经网络支持向量机贝叶斯分类器集成学习聚类降维与度量学习特征选择与稀疏学习计算学习理论半监督学习概率图模型规则学习强化学习Conv...原创 2017-12-06 13:39:26 · 5587 阅读 · 1 评论 -
概率图模型: Coursera课程资源分享和简介
转载自:http://blog.csdn.net/thither_shore/article/details/52185758本博客中概率图模型(Probabilistic Graphical Model)系列笔记以 Stanford 教授 Daphne Koller 的公开课 Probabilistic Graphical Model 为主线,结合资料(每篇博文脚注都附有链接)加以补转载 2017-12-12 20:44:32 · 2348 阅读 · 3 评论 -
机器学习算法---微积分与矩阵
微积分:极限、无穷小、导数、高阶导数、泰勒级数、无穷求和、牛顿-莱布尼茨公式;牛顿法:线性代数:低维到高维、高维到低维映射都有映射规则;实例PCA:实例解析:相关算法思想:https://blog.csdn.net/American199062/article/details/51344067https://blog.csdn.net/hongqiang200/article/details/38...原创 2018-03-28 14:17:45 · 708 阅读 · 0 评论 -
机器学习算法--概率与凸优化
概率论古典概率 or 统计定义:频率现代概率 or 公理化定义:测度论(科尔莫戈罗夫)概率空间(Ω,φ,P):Ω 样本空间(最小不可分的独立互斥事件集合);φ事件(Ω的子集);P测度(事件的概率);随机变量:随机试验各种结果的实值单值函数贝叶斯公式:贝叶斯法则是关于随机事件A和B的条件概率和边缘概率的。其中P(A|B)是在B发生的情况下A发生的可能性。 为完备事件组,即 在贝叶斯法则中,每个名词...原创 2018-03-29 14:01:23 · 838 阅读 · 0 评论 -
机器学习.周志华《3 线性模型》
线性模型: 1. 假定示例有dd个属性,x=(x1,x2,...,xd)2. 试图通过属性的线性组合进行预测用向量形式表示就是: 线性模型虽然简单,但却是基础。先研究线性、单属性的线性回归问题,其次进一步研究非线性、多属性的回归和分类问题。单属性回归:多属性回归:然后在实际情况中这个条件不一定能够满足,比如属性数目比较多,甚至超过样例数,导致XX的列数多于行数,这就相当于多元方程组变量数目>...原创 2018-04-01 22:23:51 · 990 阅读 · 0 评论 -
机器学习.周志华《4 决策树》
决策树 决策树学习是一种逼近离散值目标函数的方法,在这种方法中学习到的函数被表示为一棵决策树。4.1 基本流程决策树的生成是一个递归过程:以下3种情况会导致递归返回1) 当前节点包含的样本全属于同一类别;2) 当前属性集为空或所有样本在所有的属性上取值心痛,无法划分;3) 当前节点包含的样本集为空;一般一颗决策树包含:一个根节点、若干个内部节点和若干个叶子节点:* 每个非叶节点表示一个特征属性测试...原创 2018-04-02 13:21:38 · 1092 阅读 · 0 评论