自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 缓存异常

一 缓存穿透缓存与数据库中都没有的数据,同一时间大量请求涌入造成DB压力解决方案:缓存空对象布隆过滤器二 缓存击穿三 缓存雪崩

2020-12-24 10:17:52 229

原创 PYTHON基础

# 1 Variablesdays_1 = 365days_2 = 366print('string')print(days_1)print(days_2)str_test = 'China'int_test = 123float_test = 123.45print(type(str_test))print(str_test)print(type(int_test))print(int_test)print(type(float_test))print(float_t.

2020-10-28 15:52:32 137

原创 十八: 图片文字识别

1 识别步骤 <1>原始图片<2> 文字侦测(Text detection) : 从复杂图片中提取文字<3>字符拆分(Character segmentation) :将文字拆分为字符<4> 字符分类(Character classification):确认单一字符的意义2 滑动窗口从图像中识别对象的技术,以人物识别为例,过程如下;首先,需要使用大量图片训练出人物识别模型;将图片按模型尺寸依次...

2020-09-15 17:24:37 278

原创 十七: 大规模机器学习

1 因为大量样本训练代价比较高,建议先使用学习曲线评估是否需要这么大的数据量2 使用随机梯度下降法替代批量梯度下降法,省去训练集求和以随机训练样本数据计算,降低代价: 但是此方法无法保证每一步都沿着正确方向下降,也可能无法收敛到最小点,在其周边徘徊: 收敛检查:每迭代x次,计算这x次代价均值,绘制图表如下 1> 图线下降,是在收敛的 2> 图线上下浮动不...

2020-09-09 20:57:49 190

原创 十六: 推荐系统

1 基于内容的推荐系统设定推荐的东西有一定的特征数据,使用表示第i个推荐物的特征向量使用表示第j个用户的参数向量 (这里产生了不同,对于每个用户有自己的参数向量)则该用户线性模型代价函数可表示为: (i:r(i,j)表示只纳入用户参与评价的推荐物进行计算,r(i,j)=1代表用户对推荐物评价过) (y(i,j)代表用户j...

2020-09-09 19:56:54 107

原创 十五: 异常检测

1 动机异常检测问题,预测Xtest是否异常,用于非监督学习问题(又类似监督学习)密度估计: 2 高斯/正态分布规则:变量 x 符合高斯分布 x~N(μ,σ2)则其概率密度函数为 图例: 3 算法异常检测算法:使用训练数据计算均值与方差...

2020-09-08 15:57:34 190

原创 十四: 降维

1 动机数据压缩:太多的特征会使得增加算法训练困难度,且可能存在冗余特征(如物体的厘米和物体的英寸) 数据可视化:多特征值无法可视化,降维后可视化可以帮助我们更好的分析数据;2 主成分分析PCA需要将n维数据降至k维,寻找一个经过原点的方向向量(u1,u2...uk),使得特征向量到这个方向向量的投射误差(垂线长度)最小,是一种比较常见的降维算法。将数据特征重要性排序,省去后面维数,以此降维简化模型或者数据压...

2020-09-07 14:47:39 146

原创 十三: 聚类

1 无监督学习我们有一些没有带任何标签的数据,即系列样本x并没有对应的y,我们需要将这些x输入到一个算法中,去寻找数据的内部结构; 如上图,训练数据点可以分为两个数据点集(簇),这类点集分类算法成为聚类算法;...

2020-09-04 09:48:49 307

原创 十二: 支持向量机

1 优化目标回顾逻辑回归: 样本代价: 当观察到正样本y=1时,我们试图让远大于0,观察图可得逼近于1,观察公式可得cost会逼近于0;将逻辑回归代价函数调整为下面两条紫色拼接线条cost1(z)和cost0(z): 构建支持向量机(SVM) 【支持类别划分的超平面向量点-算法】 ...

2020-09-03 14:29:20 472

原创 十一: 系统设计

学习算法构建推荐流程:1.在短时间内构建一个简单可实现的算法,运行数据并通过交叉检验来验证数据;2. 完成第一步后,便可以绘制学习曲线,通过曲线观察算法是否有高偏差或者高方差的问题,以此作为下一步决策的依据, 是添加更多训练集还是增减特征等等;3. 人工检查交叉验证集中预测失败的数据(误差分析),来发觉算法的缺陷去修复;类偏斜的误差度量:在训练集中,某一类数据占高比,其它类占很小比例甚至没有;为了确认这个问题,引入 查准率:TP/(TP+FP) 即所有预测为真的...

2020-09-02 10:42:20 117

原创 十: 假设选择

当训练模型存在较大误差的调优可选项:1. 获得更多的训练实例——通常是有效的,但代价较大,下面的方法也可能有效,可考虑先采用下面的几种方法。2. 尝试减少特征的数量3. 尝试获得更多的特征4. 尝试增加多项式特征5. 尝试减少归一化程度 λ6. 尝试增加归一化程度 λ每一个选项都可能耗费我们巨大的经历,所以在选择调优项之前,我们可以使用"机器学习诊断法"这种测试法,来了解某种算法到底是否有用,来为我们提供有意义有价值的尝试方向。1 评估一个假设之前提到的算法,利用代价函数.

2020-09-01 10:46:55 332

原创 九: 神经网络的学习

1 代价函数令L代表神经网络层数,代表第l层神经元的个数(即代表最后一层神经元的个数),则神经网络分类可表达如下:<1> 二类分类:=1,y=1/0表示分到哪一类<2> 多类分类:=k,=1表示分到第i类通过逻辑回归代价函数: 可将神经网络代价函数表示如下: 在神经网络中,hθ(x)是一个维度为k的向量,对于每一行特征,我们都将做出k个预测,选取可能性最高的一个,与实际值做比;即样本与每个类输出差...

2020-08-31 14:25:54 153

原创 八: 神经网络-表述

1 非线性假设 当预测一些特征值特别多的模型时(如:识别图片是否为汽车,提取所有像素点),使用非线性回归的多项式项,能够帮助我们更好的分类模型;2 模型表示一大脑神经网络:多个神经元(多输入/树突,一个输出/轴突)相互链接并通过电脉冲来交流的一个网 Layer1: 输入单元,接收原始数据 Layer2: 中间单元(隐藏层),数据处理 Layer3: 输出单元,计算hθ(x)...

2020-08-28 17:41:04 622

原创 七: 正则化

1 过拟合问题观察如下拟合案例: 线性回归-三种拟合模型 逻辑回归-三种拟合模型 当采用第一种拟合方式,模型较为粗糙,预测值与实际值存在一定的误差; 当采用第二种拟合方式,模型较为精准的拟合了我们的训练数...

2020-08-27 17:45:00 104

原创 六:逻辑回归

1 分类问题 输出变量为有限个离散变量的预测问题; 输出空间非度量空间,定性评判错误与否; 如:一颗肿瘤是良性还是恶性的,金融交易是否是欺诈 以二元分类为例: 设因变量可能属于的两个类为0-负向类,1-正向类,表达为...

2020-08-25 17:33:56 274

原创 五: Octave基本操作

1 基本运算+ - * / ^ (加减乘除次方)== ~= (相等不等判断)&& || (逻辑运算)xor(a,b) (异或运算)% 注释符2 变量 a=1 a='teststr' a=(a>=2) a=pi format long/short (格式控制) disp(sprintf('2 decimals: %0.2f',a)) (自定义格式输出) who/whos (查看变量) clear xx (清除变量)...

2020-08-19 10:33:51 257

原创 四: 多变量线性回归

1 概念基于单变量的线性回归模型,如果我们加入更多的特征/参数,如之前提到的房屋预测模型,除面积外,还可添加卧室数量,房屋朝向,楼层......影响因子,那我们的假设可以更新为如下: 设X0为1,那么我们的参数以及每一条训练样本数据均为n+1维向量,特征矩阵维m*(n+1)维的矩阵;公式可以简化为: 2 多变量梯度下降...

2020-08-14 16:53:18 503

原创 三:线性代数回顾

一 概念引入特征数据的选择对于学习算法的训练结果有着非常重要的意义,使用不同的特征数据或会运算出完全不同的模型;以课时二的训练为例,当我们只考虑房间大小,得到简单的线性回归这类情况简单适配样本数据,未考虑完善影响因素,可理解为欠拟合当我们考虑大小二次方,或能得到一个更贴近实际图的二次回归线这类情况结果或更贴近实际走势图当我们考虑多次方数据去适配样本数据,或能得到一个经过所有测试点的曲线图这类情况过度匹配当前样本数据,可理解为过拟合二 定义参数学习算法:有..

2020-08-11 16:25:12 170

原创 二: 单变量线性回归

符号: m : 训练样本数 x : 输入变量/特征 y : 输出变量/目标变量 (x(i), y(i)) : 样本 h : 假设函数 n : 特征数学习流: h可接受新输入x,计算出输出y;EG:房屋价格预测样本数据:N条房价数据,包括房屋面积,卧室数量,房屋价格Step1:确立假设Step2: 问题转化 ...

2020-08-10 17:39:18 210

原创 一:引言

Pre: 计算机基础 数理统计基础 MATLAB/Octave机器学习? 对于一个计算机程序来说,给它一个任务T和一个结果性能测量P,P受到经验E影响得到提升,可以理解为程序有从E学习;课程内容:> 监督学习> 理论证明支撑> 无监督学习> 强化学习...

2020-08-10 17:28:26 69

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除