Machine Learning
文章平均质量分 62
机器学习与深度学习
Not_Today.
道法自然
展开
-
贝叶斯定律
先复习一些概率理论。联合概率:事件 A 和事件 B 同时发生的概率;也叫做乘积法则。P(A,B)=P(A∩B)=P(A∣B)P(B)=P(B∣A)P(A)P(A,B) = P(A \cap B) = P(A|B)P(B) = P(B|A)P(A)P(A,B)=P(A∩B)=P(A∣B)P(B)=P(B∣A)P(A)求和规则:事件 A 和 事件 B不同时发生的概率。P(A∪B)=P(A)+P(B)−P(A∩B)P(A \cup B) = P(A) + P(B)-P(A\cap B)P(A∪B)=P(A)+P(原创 2022-07-07 00:22:52 · 632 阅读 · 0 评论 -
深度学习的历史
概念层面上来讲,深度学习是受到大脑的启发。就像飞机的设计灵感来自鸟类。虽然它们的基本原理一致,但细节却大相径庭。深度学习的历史可以追溯到现在更名为「控制论」(cybernetics)的领域。它始于 1940 年代的 McCulloch 和 Pitts,他们提出了神经元是具有开启和关闭状态的阈值单元,可以通过构建逻辑推理并将神经元相互连接来构建布尔电路。大脑基本上是一个逻辑推理机,因为神经元的开启和关闭状态是二元的。神经元计算输入的加权总和,并将该总和与其阈值进行比较。如果它高于阈值则打开,如果低于阈值则原创 2022-06-29 16:57:22 · 1177 阅读 · 0 评论 -
机器学习系统在生产中的挑战
机器学习和深度学习在过去的几年迅速火热起来,但网上的一些资料和课堂中的教学大部分都是以构建模型和调节模型为主。然而在实际的生产中,机器学习工程师的职责不仅仅是构建模型和维护模型,更需要掌握一些软件工程的技能。大多数的公司在过去的几年中才开始使用机器学习技术,或者开发相关系统。而在规模化开发和运行机器学习系统的公司更是不多。而在运行系统中,常常会遇到一些挑战,这篇文章是想深入讨论一下运行机器学习系统的几个挑战。机器学习的开发是一个迭代过程。需要对数据、学习算法和模型参数的多种组合进行试验,并跟踪这些变化对预测原创 2022-06-26 21:12:48 · 321 阅读 · 0 评论 -
机器学习岗位面试中的数据结构和算法
数据结构和算法几乎是程序员面试中都要考察的部分。重要程度不需要我多少,这些也是非常值得花时间去学习的。这篇文章不仅能给你提供一些学习数据结构和算法的思路,还能给你在面试机器学习岗位时提供一些建议。如果你对数据结构和算法并不了解,可以通过网上的视频和书籍来进行学习,大多都是免费的。最好的教材和内容往往也都是免费的!想要系统的学习数据结构和算法,我推荐《算法4》和《算法导论》,这两本书能帮助你系统的学习数据结构与算法。《算法4》是一本非常实用的算法书籍,里面的问题大多都是工作中的实际问题,非常偏应用。《算法4》原创 2022-06-23 22:25:55 · 605 阅读 · 0 评论 -
机器学习工作岗位
以下列举了一些常见的机器学习岗位,这些岗位的需求是变动的。需求的变化基于不同公司的具体需求。原创 2022-06-23 11:23:45 · 2050 阅读 · 0 评论 -
机器学习开发项目流程
机器学习开发项目流程1. 机器学习开发流程1.1 数据1.2 模型选择1.3 模型训练1.4 模型测试1.5 模型部署机器学习不只是模型!传统的软件开发流程大致如下:相比较于机器学习的对学科性质,传统的软件开发流程并不能解决机器学习开发过程中的问题。1. 机器学习开发流程本篇基于前文 机器学习项目周期进行进一步拓展。1.1 数据一切从数据开始。对于要实现的项目目标,我们是否能获取到有效数据来支持项目开发?数据的质量比模型本身更重要,高质量的数据是机器学习开发的关键。一些可扩展的数据储存原创 2022-05-10 13:35:00 · 1456 阅读 · 0 评论 -
机器学习项目周期
机器学习项目生命周期1.计划项目这个阶段我们确定要解决什么样的问题,实现预期目标。还要考虑AI的道德影响,等一些潜在问题。2.收集标注数据在这个阶段,我们确定数据的来源,基于什么样的事实来对数据进行标注。一些时候,可使用的数据质量并不是很高,我们可能要收集更多的数据,并回到第一步重新分析问题和预期目标。3.训练调节模型这个阶段我们快速搭建模型。应用先进的方法,调节我们的模型。这个阶段我们可能会看到我们收集的数据并不一定可靠,因此我们可能回到第二部重新整理数据。此外,还要审视预期目标是原创 2022-04-19 12:29:31 · 1116 阅读 · 0 评论 -
机器学习应用开发中的问题
ML应用程序开发面临的一些问题。监控:如何知道你的数据分布发生了变化。数据标注:如何快速标注新数据或为新模型重新标注数据。CI/CD测试:如何保证模型在每次更改后仍然按照预期工作,因为调试模型需要几天的时间。部署:如何打包和部署新模型或替换现有模型。模型压缩:如何压缩模型以适应消费类设备,例如 手机硬件设备:有没有快速且廉价的硬件来运行ML算法。隐私:如何使用用户数据来训练模型且同时保护他们的隐私。公司面对的难题:ML研究人员和软件开发工程师之间缺乏沟通,因为研究团队和软件开发团队是分开的原创 2022-04-18 17:59:46 · 136 阅读 · 0 评论 -
矩阵求导法则,梯度求导方式
梯度向量的求导方式。忘记的常来看看。原创 2022-03-28 20:40:06 · 498 阅读 · 0 评论 -
线性回归X为矩阵时闭式解推导
损失函数求最小:对公式变形:应用如下两个矩阵求导规则:对w求梯度:最后变形得:原创 2022-02-16 18:12:53 · 551 阅读 · 0 评论 -
机器学习算法——线性回归(超级详细总结)
目录1.线性回归模型1.1公式1.2向量化公式1.3 MSE损失函数2.优化算法2.1 标准方程2.2 批量梯度下降梯度下降1.线性回归模型1.1公式y^ 是预测值n 是特征数量xi 是第i个特征θi 是每个特征的模型参数1.2向量化公式θ.T是θ的转置向量。θ.T · x 是θ.T和x的点乘hθ(X) 是θ的假设函数1.3 MSE损失函数线性回归的损失函数通常使用MSE(均方误差), 其原理对于欧几里得距离,当数据含有异常值的的时候,可以使用MAE(均值误差),对应曼哈顿距离原创 2022-01-30 22:28:28 · 1631 阅读 · 0 评论 -
机器学习创建训练和测试集的方法
目录1.随机抽样方法手动分离数据集标识符法numpy 包 train_test_split2.分层抽样1.随机抽样方法手动分离数据集以房价数据集为例 8:2的比例分配训练集和测试集import numpy as npdef split_train_test(data, test_ratio): # 数据集shape[0]长度的随机序列 np.random.seed(33) # 确保生成序列一致,保持每次生成数据集一直 indices = np.random.permutation(len(原创 2022-01-26 15:44:21 · 3667 阅读 · 0 评论 -
机器学习概述(机器学习实战)
文章目的只做简单介绍。一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P,随着E的增加而增加,可以称其为学习。 ——Tom Mitchell,1997概述1.什么是机器学习?1.1 机器学习系统的种类1.1.1监督式学习类别(回归和分类)1.1.2 无监督式学习类别1.1.3 半监督式学习1.1.4强化学习1.1.5 批量学习和在线学习1.1.6 基于实例与基于模型的学习1.2 机器学习挑战。2.1"数据问题"2.2"算法问题"1.3 测试与验证评估原创 2022-01-24 11:30:27 · 1377 阅读 · 0 评论 -
深度解析梯度下降及其详细知识(Gradient Descent)
深度解析梯度下降及其详细知识(Gradient Descent)本篇文章侧重于解析机器学习中梯度下降的原理。目录:深度解析梯度下降及其详细知识(Gradient Descent)前言:1. 什么是凸优化问题凸集其次什么是凸函数2. 解析梯度下降梯度下降过程明确梯度是什么梯度下降及其参数3.梯度下降演练一元函数梯度下降多元函数梯度下降结语前言:在开始之前我们先笼统的描述一下什么是梯度下降,简单来说梯度下降用来解决机器学习中的模型优化问题。优化问题又分为凸优化问题和非凸优化问题:一个问题如果是凸优化问题原创 2021-10-31 17:34:18 · 1597 阅读 · 0 评论 -
机器学习全面知识点总结(小白入门!)
**机器学习相关总结(小白入门!)**目录机器学习的特点机器学习的研究对象机器学习的应用#大家好,这篇博文主要介绍机器学习相关的基本理论和部分应用,目的是帮助初学者对机器学习建立初步的认知框架,文章通俗易懂,以后博主还会根据具体的机器学习实践和部分模型模型应用更深入的帮助大家汇总相关知识。现在让我们开始吧!!!1.机器学习的特点*简单来说机器学习的特性是从我们已经拥有的数据的特征(Data)和其对应的对照的答案(Label)寻找某种规则。Data和Label 帮助大家理解,后续我们会原创 2021-06-06 01:05:37 · 9833 阅读 · 2 评论