自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 问答 (32)
  • 收藏
  • 关注

原创 绝对通俗易懂SVM的理解,大白话

本文目的,站在一个小白的角度,从简单易懂的角度分析下SVM,有不对的地方还请指出,感激不尽主要参考博文:http://f.dataguru.cn/thread-371987-1-1.htmlhttp://blog.csdn.net/dadouyawp/article/details/51059469http://blog.csdn.net/lisi1129/article/deta...

2018-03-06 14:13:51 13345 7

原创 【闭眼瞎说】为什么速度越快时间越慢

为什么速度越快时间越慢

2022-09-06 15:57:07 1219 1

原创 【推荐系统】隐语义模型

参考:https://www.jianshu.com/p/7b6bb28c1753未完待续

2018-09-02 20:01:01 409

原创 【推荐系统】协同过滤

一、协同过滤:找到与某用户有相同偏好的其它用户,具体步骤:1 收集用户偏好(比如电影推荐时,某用户对某电影的的打分,评论、转发等)2 找到相似的用户或者物品3 计算推荐基于用户的协同过滤:计算用户之间的相似度 用户A与用户C很相似,但是A没有买物品D,所以给A推荐物品D存在问题:1 对于一个新用户,很难找到与他相近的用户2 对于一个物品(本来想推荐给A的),...

2018-09-02 15:11:31 691

原创 【人脸识别】人脸特征提取方法简述

我们知道人脸识别一个常用方法是先提取人脸的128维特征点,然后根据不同的算法比较特征点进行人脸识别工作,那么这个128维特征点是怎么提取的呢?方法一:网络我们选择卷积神经网络,使得网络最后输出是128维的向量,损失函数选择三元组损失:其中A为一个人的照片,P是此人的另一张照片,N是另一个人的照片,α是间隔(超参数),比如是0.2,意义是非自己的人脸距离至少比自己人脸距离远0.2个距...

2018-08-24 22:33:54 30358 5

原创 【目标检测】简述

特征点检测比如要检测人脸的64个特征点,这些特征点围绕眼镜、嘴巴,我们可以人为的标记特征点在训练图片上,然后用卷积网络最后一层来输出这些点(128个,包括x、y的坐标),通过某种损失函数,比如均方误差或者交叉熵来进行训练 基于滑动窗口的目标检测:第一步:训练单张图片的卷积网络(每张图片几乎被要检测的物体充满)第二步:通过大小不同的窗口从左上方一直滑动到右下方寻找目标:...

2018-08-23 17:23:59 881

原创 【深度学习】Inception网络浅析

Inception模块:思想:由于一般的卷积网络需要选择使用何种卷积核(3*3或者5*5),而Inception网络可以初始选择的值(如上图初始有4种)然后Inception网络会拼接起所有卷积核的大小,自己学习应该采取哪些过滤器的组合 计算量问题我们观察下5*5的情况,需要乘法次数是28*28*32*5*5*192大约等于1.2亿次,下面通过1*1的卷积核来优化计算量:...

2018-08-21 21:07:58 1311 1

原创 【深度学习】ResNet网络浅析

ResNet网络是基于残差块的网络模型,先介绍下什么是残差块(Residual block):红色圈画的即为一个残差块,与普通的网络相比,区别就是求a[l+2]的时候多加了前面的a[l]这个残差 残差网络:左图为普通的网络,右图为ResNet。理论上随着网络层数的增加,损失会不断下降,实际上却是左图,因为随着网络的增加,优化函数会越来越难优化 为什么深层网络损失会上...

2018-08-20 22:06:13 1328

原创 经典算法思路总结

1、n 从 1 开始,每个操作可以选择对 n 加 1,或者对 n 加倍。如果最后结果为 2013,最少 需要()个操作https://www.nowcoder.com/questionTerminal/5e27998c3f854109905610cac8a5d802?pos=73&mutiTagIds=602&orderByHotValue=1  2、给定一个字符串...

2018-08-17 20:58:42 1622

转载 【机器学习】监督学习的分类:判别/生成模型,概率/非概率模型、参数/非参数模型

转载:https://blog.csdn.net/qq_39521554/article/details/79134274机器学习是一个有着多分支的学科。其中,监督学习是其中发展最为成熟的分支。这不仅是由于在监督学习框架下面有各种各样的学习模型,如逻辑斯特回归、朴素贝叶斯、支持向量机等,更是因为这个框架有着坚实的理论支撑,机器学习中的计算学习理论就是主要为监督学习服务的:这套理论以概率的方式回...

2018-08-16 16:35:26 3435

原创 【机器学习】梯度下降、牛顿法、拟牛顿法

梯度下降的数学原理:https://mp.weixin.qq.com/s?__biz=MzIwOTc2MTUyMg==&mid=2247484072&idx=1&sn=ada7113781fa20a61e1b3d84df98f7bb&chksm=976fa735a0182e238443c35584bb7f5c2dd21100c7bce79711f3802b679...

2018-08-15 20:28:34 339

转载 【机器学习】各种回归总结

参考:https://mp.weixin.qq.com/s/mr83EK24S94b_UUlecyqlAhttps://www.jianshu.com/p/1677d27e08a7http://www.360doc.com/content/17/0608/14/38334011_661059440.shtml

2018-08-10 16:03:47 484

原创 【深度学习】常见卷积核总结

1 垂直边缘检测  2 水平边缘检测   3 sobel 滤波(横向同理)   4 scharr滤波器(横向同理) 5 

2018-07-20 11:46:01 9665

原创 【深度学习】数据归一化与标准化

参考:https://www.zhihu.com/question/20455227https://www.jianshu.com/p/4c3081d40ca61. 什么是数据归一化?归一化(标准化)可以定义为:归一化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保证模型运行时收敛加快。归一化和标准化的区别:...

2018-07-13 14:46:37 18977 2

原创 【深度学习】梯度下降优化方法

指数加权平均的概念上图中的0.9称之为β,θ1代表第一天的温度,v相当于平均1/(1-β)的天数的数据解释:当到10天后,由于0.9的10次方减少到比较小的值,故可认为v相当于平均1/(1-β)的天数的数据,此时β为0.9 动量梯度下降(Momentum)更新w:w=w-αVdw   更新b同理效果(红色为采用动量梯度下降后):RMSprop梯度下降更新参数:Adam优化梯度下降修正后的动量和RM...

2018-07-11 22:34:11 822

原创 【机器学习】朴素贝叶斯进行文本分类

基本步骤(2分类):根据要分类的文本,建立不重复词的列表->对于每一条文本,转化‘文档向量’(此向量长度为上一步的列表,值为1或者0)->根据计算分类概率,大概思路是训练一个文档集合(已转化为文档向量),若文档为1,把文档list对应位置相加作为分子,同时分母+1,这样最后加起来的list再除分母(后面称这个分子除分母为listA)就得到了文档为1时所有单词的概率,即,在预测x文档向量...

2018-07-10 11:29:44 493

原创 【人脸识别】整个服务流程

在经过之前提到过了2种方法,最终实验结论是通过提取特征值+KNN的方法准确率较高,故采用此方法,具体流程如下:整套人脸识别通过python 的Django框架实现服务接口1 图片质量检测客户通过app注册人脸,后端拿到人脸后,首先进行图片的质量检测,具体是检测是否有人脸,有人脸的情况下再检测是否能找到眼镜、鼻子,若都可以找到,则通过检测,进入下一步,若不通过,提示客户重新拍照2 注册人脸图片通过质...

2018-07-09 21:21:07 1736

原创 【人脸识别】dlib提取特征值+KNN方法

步骤   训练模型(通过预先提取的特征值,用KNN建模)->用KNN预测1 加载之前提取的128维特征向量我将它保存到了txt中,训练了2000多个人code:import cv2import numpy as npfrom sklearn import neighborsimport dlibimport timepredictor = dlib.shape_predict...

2018-07-09 19:48:10 5515

原创 【人脸识别】通过opencv进行人脸识别

opencv人脸识别主要有3种算法1 EigenFace,大题思路是用PCA  对人脸进行降维,在比较距离2 FisherFace,基于LDA降维3 LBPH 利用局部二值模式直方图的人脸识别算法具体步骤:一、人脸的训练,需要将训练图片中人脸扣出->正脸->转化灰度图->直方图均衡化->训练二、经过同样步骤处理图片,然后预测下面具体演示一下,用LBPH算法,训练我准备好的图...

2018-07-09 17:28:04 1039

原创 【人脸识别】提取68维特征值与正脸操作

我做的项目大题有两种思路,一是用opencv库直接训练预测,第二种是通过dlib库提取特征值在根据特征值用其它的机器学习方法预测先说第二种方法(检测人脸并提取68维特征值->68维特征值转128维特征值->KNN比较128维距离):技术点一,检测人脸提取68维特征值:import dlibimport cv2#源程序是用sys.argv从命令行参数去获取训练模型,精简版我直接把...

2018-07-09 16:17:03 6965

原创 算法笔试题总结

1 有一个序列a[0]、a[1]、到a[n-1]   长度大于4  ,必存在i 、j、 p、 q ,使得i<j<p<q ,找出a[j]-a[i]+a[q]-a[p]的最大值2 有一个序列a[0]、a[1]、到a[n-1] 长度为n,找出某k,使得前k个方差和后n-k个方差和最大...

2018-07-09 09:17:58 328

原创 【机器学习】关于样本不均衡问题

参考:https://www.jianshu.com/p/be343414dd24问题解决难度:大数据+分布均衡<大数据+分布不均衡<小数据+数据均衡<小数据+数据不均衡方法一:采样采样分为上采样和下采样:上采样会把小众样本复制多份,这样容易造成过拟合问题,解决方法是在重复样本中加入轻微的随机扰动下采样是随机选取大众类,使其和小众类有相同的样本,这样会造成模型的不完整,解决方法是...

2018-07-07 10:37:35 1050

原创 【机器学习】K-means算法和DBSCAN算法

一张图搞定k-means:初始化指定分为几个簇,比如上图是分2个簇第一步:随机找2个质心,根据欧氏距离分类(c)第二步:根据c图,再重新求红色的质心,蓝色的质心第三步:根据新的质心重新分配样本(e)迭代二三步,直到质心不再发生改变DBSCAN(Density Based Spatial Clustering of Applications with Noise):...

2018-07-06 21:20:01 1082

原创 【深度学习】感受野

参考https://www.jianshu.com/p/856538bde67f核心公式:n_in:输入图特征大小(开始就是原始图的某维度,比如30*30的图片,n_in就是30)p:padding大小k:卷积核大小(比如3*3的卷积核,k就是3)s:步长n_out:输出图像特征大小j_in:输入图特征间的间隔j_out:输出图特征间的间隔r_in:输入图感受野的大小r_out:输出图感受野的大小...

2018-07-06 16:49:30 977

原创 【opencv】SIFT算法进行图像特征点匹配

参考https://www.cnblogs.com/cj695/p/4041478.html目的:输入:商品货架一层输出:圈出这一层想找的商品import cv2def sift_kp(image): gray_image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY) sift = cv2.xfeatures2d_SIFT.create...

2018-07-03 15:16:15 3360

原创 【深度学习】问题总结

1 什么是结构化数据有明确的特征值的数据,比如年龄等无明确的特征值的数据称之为非结构化数据,比如图片 2 为什么近几年深度学习发展如此迅速数据量的变大计算机运算速度的变快 3 神经网络中w初试值不能为0向量若w全部初始值为0,隐藏层中每个单元算出相同的值,在BP算法改变w时会发现每组w是相同的,即一个隐藏层中的所有单元失去作用...

2018-06-25 21:56:17 299

原创 【机器学习】模型评估方法

参考 :http://charleshm.github.io/2016/03/Model-Performance/           https://blog.csdn.net/zdy0_2004/article/details/44948511 准确率(accuracy):平常说的正确率= (TP+TN)/(TP+FN+FP+TN)精确率(precision)(查准率):预...

2018-06-25 15:40:09 368

原创 HDFS原理

参考:https://www.jianshu.com/p/855dff19fd661 namenode与datanodenamenode是数据管理者,存放数据目录datanode存放数据,数据分块处理,在hadoop2.0中每块128M(必须一块块写(读),不能同时写(读))小于128M的文件不占128M空间2 HDFS架构3 HDFS元数据4 namenode具体内容5 namenode工作特点...

2018-06-20 17:16:18 173

原创 python小技巧总结

  1 math.ceil()  #向上取整   math.floor()  #向下取整   round(a,2)  #a四舍五入,保留2位小数   int()  #向下取整 ,返回整数类型   math.sqrt()  #开根号  pow(a,x) #求a的x次方2 遍历字典https://www.cnblogs.com/stuqx/p/7291948.htm...

2018-06-13 17:00:43 230

原创 【机器学习】经典问题总结

1 逻辑回归为什么用sigmod函数,以及对应损失函数为什么选极大似然简答:首先,我们在建模预测 Y|X,并认为 Y|X 服从bernoulli distribution,所以我们只需要知道 P(Y|X);其次我们需要一个线性模型,所以 P(Y|X) = f(wx)。接下来我们就只需要知道 f 是什么就行了。而我们可以通过最大熵原则推出的这个 f,就是sigmoid。为什么选择极大似然...

2018-06-13 13:50:40 560

原创 各种熵总结

2018-06-08 14:49:55 1210 2

原创 【机器学习】SVM之SMO算法

2018-05-30 17:28:02 415

原创 【机器学习】SVM拉格朗日对偶法及其KKT条件

2018-05-29 17:28:29 399

原创 【机器学习】SVM松弛变量

2018-05-24 21:13:36 1356

原创 【机器学习】SVM基础推导

2018-05-24 20:51:16 390

原创 python与java删除列表的所有指定元素方法

在python里,我们知道直接用remove或者pop的for循环删除会出现问题,正确如下:python:a=[1,1,3,2]while 1 in a: a.remove(1)print(a) #输出[3,2]java:同理,java用for删除也会出问题,正确方法是用迭代器:List<Integer> n1=new ArrayList<Integer>()...

2018-05-22 16:46:27 253

原创 【机器学习】PCA原理分析

2018-05-22 10:28:31 228

原创 【机器学习】Xgboost算法

2018-05-17 20:50:33 256

原创 【机器学习】GBDT算法

GBDT算法用于分类问题:https://blog.csdn.net/qq_22238533/article/details/79192579

2018-05-17 15:06:01 214

原创 【机器学习】前向分步算法与boosting家族

2018-05-16 17:48:05 487

空空如也

opencv读入图片后把图像整体除2,再显示图像,为什么变白了

2019-01-04

word2016编辑公式,在公式后加上序号,序号前面会有条竖线怎么解决

2018-12-26

python 提前加载数据问题

2018-08-29

吴恩达深度学习第四课第四周fr_utils.py报错,有人遇到过吗

2018-08-26

某层商品货架根据商品切割有什么算法吗

2018-06-29

pyplot画的条形图,每个条怎么挨着

2018-06-26

Linux多用户是怎么回事,镜像复制的算是同一个用户吗

2018-06-19

spark读取不了本地文件是怎么回事

2018-05-18

pycharm 之前把2个项目合并了,怎么分开?

2018-05-14

pyspark 报错 python未找到命令

2018-05-05

hadoop集群搭建好后Datenode诡异的再master机器上开启,没有在slave机器上开启

2018-05-04

Ubuntu18 +hadoop2.6运行命令出一大堆警告

2018-05-01

python itemgetter的使用,如何分别降序或者升序

2018-04-30

python遍历字典出问题了

2018-04-30

VirtualBOX Ubuntu不能与主机共享文件夹

2018-04-28

Ubuntu 绿色高亮的文件夹是怎么回事

2018-04-27

kears 运行一个最简单的demo报错

2018-04-25

opencv 怎么读取打开的图片

2018-04-23

关于django项目静态文件的使用

2018-04-17

python numpy 中ndarry转成string后怎么转回来

2018-04-16

django 关于post请求长度限制问题

2018-04-16

django在哪编写自己的业务逻辑

2018-04-16

pycharm Django setting.py文件配置问题

2018-04-13

python import 一个包含类的py文件报错

2018-04-12

谁有编译好的python dlib 19.10.0的whl文件

2018-03-22

python人脸识别用什么库比较合适

2018-03-20

在python中安装opencv_contrub后出问题了

2018-03-15

anaconda如何安装已下载好的库

2018-03-15

python import 和from import 区别

2018-03-09

sk-learn中KNN算法能动态的构建ball-tree吗

2018-02-28

throw测试每次运行结果不同是怎么回事。。。

2017-11-14

JAVA操作redis两种方法的区别是什么

2017-11-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除