自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 机器学习李宏毅笔记CNN

CNN我们都知道CNN常常被用在影像处理上,如果你今天用CNN来做影像处理,当然也可以用一般的neural network来做影像处理,不一定要用CNN。比如说你想要做影像的分类,那么你就是training一个neural network,input一张图片,那么你就把这张图片表示成里面的pixel,也就是很长很长的vector。output就是(假如你有1000个类别,output就是1000个dimension)dimension。那我相信根据刚才那堂课内容,若给你一组training data你都可

2021-07-23 16:09:43 379

原创 李宏毅机器学习笔记-网络设计技巧

李宏毅机器学习笔记-网络设计技巧1 局部最小Loss在局部最小值或者鞍点处,梯度为0,因此没法继续下降。在局部最小值处,没有路可走,无法逃出来,但是在鞍点处,是可以走出来的,因此在梯度为0处要判断是否是鞍点。1.1 利用Hessian矩阵判断鞍点将Loss方程泰勒展开,其中二次项的系数矩阵,就是Hessian矩阵:如下图所示当Hessian矩阵是正定阵或负定阵时,该点是局部最小值,否则,该点是鞍点。1.2 实例如下图所示,将w1,w2以及loss画在同一张图中,其中颜色越深代表lo

2021-07-21 20:27:00 405

原创 李宏毅机器学习笔记-深度学习

李宏毅机器学习笔记-深度学习1 深度学习的三个步骤deep learning与机器学习类似,也有3个步骤:Step1:神经网络(Neural network)Step2:模型评估(Goodness of function)Step3:选择最优函数(Pick best function)那对于深度学习的Step1就是神经网络(Neural Network)1.1神经网络神经网络(Neural network)里面的节点,类似我们的神经元。神经网络也可以有很多不同的连接方式,这样就会产生

2021-07-19 00:00:08 443

原创 李宏毅机器学习笔记-误差与梯度下降

李宏毅机器学习笔记-误差与梯度下降1 误差、偏差、方差1.1 误差来源误差主要有两个来源:分别是 biasbiasbias 和 variancevariancevariance 。其中f^\hat ff^​ 就是我们的靶心(真实值),f∗f^*f∗ 就是我们投掷的结果(预测值)。如上图所示,f^\hat ff^​ 与 f∗f^*f∗ 之间蓝色部分的差距就是偏差和方差导致的。1.2估测变量x的偏差与方差对于随机变量xxx,平均值是 μ\muμ,方差为 σ2\sigma^2σ2从总体中抽取N

2021-07-16 11:52:21 227

原创 李宏毅机器学习笔记-回归

李宏毅机器学习笔记-回归1 一元线性回归与多元线性回归回归:Regression 就是找到一个函数 functionfunctionfunction ,通过输入特征 xxx,输出一个数值 ScalarScalarScalar。一元线性回归:以一个特征 xcpx_{cp}xcp​ 为例,线性模型假设 y=b+w⋅xcpy = b + w·x_{cp}y=b+w⋅xcp​ ;当xcpx_{cp}xcp​有多个特征时,线性模型:y=b+∑w⋅xcpy = b + \sum w·x_{cp}y=b+∑w⋅xc

2021-07-14 12:56:17 151

原创 datawhale组队学习-李宏毅机器学习笔记-1

2021-07-12 20:41:16 108

原创 异常检测-task5

异常检测——高维数据异常检测主要内容包括:Feature Bagging孤立森林文章目录异常检测——高维数据异常检测1、引言2、Feature Bagging3、Isolation Forests4、总结5、练习参考资料1、引言在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积)会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战,对距离的计算,聚类都带来了难题。例如基于邻近度的方法是在所有维度使用距离函数来定义局部性,但是,在

2021-05-23 22:04:01 88

原创 异常检测-task4

异常检测——基于相似度的方法(距离与密度)主要内容包括:基于距离的度量基于密度的度量1、概述  “异常”通常是一个主观的判断,什么样的数据被认为是“异常”的,需要结合业务背景和环境来具体分析确定。  实际上,数据通常嵌入在大量的噪声中,而我们所说的“异常值”通常指具有特定业务意义的那一类特殊的异常值。噪声可以视作特性较弱的异常值,没有被分析的价值。噪声和异常之间、正常数据和噪声之间的边界都是模糊的。异常值通常具有更高的离群程度分数值,同时也更具有可解释性。  在普通的数据处理中,我们常常需

2021-05-19 20:52:20 151

原创 异常检测-task3

异常检测—task3-线性相关方法1、前言  真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。在古典统计学中,这被称为——回归建模,一种参数化的相关性分析。  一类相关性分析试图通过其他变量预测单独的属性值,另一类方法用一些潜在变量来代表整个数据。前者的代表是 线性回归,后者一个典型的例子是 主成分分析。本文将会用这两种典型的线性相关分析方法进行异常检测。  需要明确的是,这里有两个重要的假设:  假设一:近似线性相关假设。线性相关假

2021-05-17 21:02:37 83

原创 碳排放计算-20210515

碳排放计算-2021/05/151、个人碳排放量计算碳排放计算器(可以参考计算器的输入数据有哪些):http://dotree.com/CarbonFootprint/计算方法可以参考:中国城市居民生活碳排放量化.pdf、高校碳足迹和碳结构探索.pdf 等(可以自行在知网、万方、csdn、知乎、哔站上面找类似的)https://wenku.baidu.com/view/f0925744bb68a98271fefab8.html (校园碳足迹报告)2、碳交易计算碳交易所:https://bl

2021-05-15 13:26:15 3346

原创 异常检测-task2

基于统计学方法的异常检测1、概述1.1 基本原理首先假设正常数据服从某一分布,对于异常点,并不符合该分布,由此可以利用统计学方法找到异常点。一般思想为:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为异常点。1.2 主要类型参数方法假定正常的数据对象被一个以Θ\ThetaΘ为参数的参数分布产生。该参数分布的概率密度函数f(x,Θ)f(x,\Theta)f(x,Θ)给出对象xxx在该分布下的概率。该值越小,xxx越可能是异常点。非参数方法并不假定先验分布,而是通

2021-05-13 21:06:33 71

原创 异常检测-task1

异常检测-task1:异常检测概述与基本实现1 异常检测定义与应用1.1 异常检测定义定义:异常检测(英语:anomaly detection)对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别,通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被

2021-05-10 15:00:59 139

原创 异常检测 task_0

异常检测 task_01 datawhale论坛与项目介绍论坛:http://datawhale.club/在论坛如何提问:http://datawhale.club/t/topic/728/2项目介绍:http://datawhale.club/t/topic/1425学习任务:https://github.com/datawhalechina/team-learningPPT简介:https://datawhale.feishu.cn/docs/doccnY7uZLRKtxWpU5oazEf

2021-05-09 20:36:43 139

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除