- 博客(37)
- 资源 (16)
- 收藏
- 关注
原创 LeetCode#17. 电话号码的字母组合
给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。示例:输入:"23"输出:["ad", "ae", "af", "bd", "be", "bf", "cd", "ce", "cf"].说明:尽管上面的答案是按字典序排列的
2018-06-30 23:07:08 187
转载 基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN
原文链接:点击打开链接object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别。object detection要解决的问题就是物体在哪里,是什么这整个流程的问题。然而,这个问题可不是那么容易解决的,物体的尺寸变化范围很大,摆放物体的角度,姿态不定,而且可以出现在图片的任何地方,更何况物体还可以是多个类别。object detection技术的演进:RC...
2018-06-28 09:47:29 319
转载 基于深度学习的目标检测
1.1 选择性搜索(Selective search)目标检测的第一步是要做区域提名(Region Proposal),也就是找出可能的感兴趣区域(Region Of Interest, ROI)。区域提名类似于光学字符识别(OCR)领域的切分,OCR切分常用过切分方法,简单说就是尽量切碎到小的连通域(比如小的笔画之类),然后再根据相邻块的一些形态学特征进行合并。但目标检测的对象相比OCR领域千差...
2018-06-27 21:54:38 460
转载 线性判别分析(LDA)和 主成分分析(PCA)
原文链接:点击打开链接如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了。谈到LDA,就不得不谈谈PCA,PCA是一个和LDA非常相关的算法,从推导、求解、到算法最终的结果,都有着相当的相似。 本次的内容主要是以推导数学公式为主,都是从算法的物理意义出发,然后一步一步最终推导到最终的式子,LD...
2018-06-26 17:14:00 2474
转载 机器学习特征选择方法
原文链接:点击打开链接3.特征选择当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练。通常来说,从两个方面考虑来选择特征:特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差异,这个特征对于样本的区分并没有什么用。特征与目标的相关性:这点比较显见,与目标相关性高的特征,应当优选选择。除方差法外,本文介绍的其他方法均从相关性考虑。根据特征...
2018-06-26 16:38:47 5281 1
转载 几种常用的特征选择方法
原文链接:点击打开链接特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择一种自己...
2018-06-26 15:55:50 18759 4
转载 笔试编程题输入输出模板备忘
C++:借用C++中的new/delete#include "stdlib.h"#include <iostream>using namespace std;int main(){ int m, n; //cout << "请输入行和列:"; cin >> m >> n; //动态开辟空间 in...
2018-06-26 15:27:22 1426
转载 常用激活函数的总结与比较
原文链接:点击打开链接 ,点击打开链接本文结构:什么是激活函数为什么要用都有什么sigmoid ,ReLU, softmax 的比较如何选择1. 什么是激活函数如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这个函数就是激活函数 Activation Function。2. 为什么要用如果不用激励函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是...
2018-06-25 23:04:45 4845
转载 优化方法总结:SGD,Momentum,AdaGrad,RMSProp,Adam
1. SGDBatch Gradient Descent在每一轮的训练过程中,Batch Gradient Descent算法用整个训练集的数据计算cost fuction的梯度,并用该梯度对模型参数进行更新:Θ=Θ−α⋅▽ΘJ(Θ)Θ=Θ−α⋅▽ΘJ(Θ)优点:cost fuction若为凸函数,能够保证收敛到全局最优值;若为非凸函数,能够收敛到局部最优值缺点:由于每轮迭代都需要在整个数据集上计...
2018-06-25 22:17:01 351
转载 推荐系统介绍:(协同过滤)—Intro to Recommender Systems: Collaborative Filtering
原文链接:点击打开链接本文试验前期准备:MovieLens ml-100k数据集Jupyter notebookthemoviedb.org API key 本文试验内容翻译自:http://blog.ethanrosenthal.com/2015/11/02/intro-to-collaborative-filtering/ 添加python引用import numpy as npimpor...
2018-06-25 21:29:56 565
转载 协同过滤推荐算法的原理
原文链接:点击打开链接一、协同过滤算法的原理及实现二、基于物品的协同过滤算法详解一、协同过滤算法的原理及实现协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filt...
2018-06-25 19:46:45 1520
转载 Boost算法(GDBT,AdaBoost,XGBoost)原理
原文链接:点击打开链接简单地来说,提升Boost就是指每一步都产生一个弱预测模型,然后加权累加到总模型中,然后每一步弱预测模型生成的的依据都是损失函数的负梯度方向,这样若干步以后就可以达到逼近损失函数局部最小值的目标。首先Boost肯定是一个加法模型,它是由若干个基函数及其权值乘积之和的累加,即其中b是基函数,beta是基函数的系数,这就是我们最终分类器的样子,现在的目标就是想办法使损失函数的期望...
2018-06-22 17:19:47 1455
转载 理解GB、GBDT、xgboost、lightGBM
GBDT和xgboost在竞赛和工业界使用都非常频繁,能有效的应用到分类、回归、排序问题,虽然使用起来不难,但是要能完整的理解还是有一点麻烦的。本文尝试一步一步梳理GB、GBDT、xgboost,它们之间有非常紧密的联系,GBDT是以决策树(CART)为基学习器的GB算法,xgboost扩展和改进了GDBT,xgboost算法更快,准确率也相对高一些。 1. Gradient boostin...
2018-06-22 16:57:56 678 1
转载 机器学习三大神器GBDT、XGBoost、LightGBM
原文链接:点击打开链接本文主要简要的比较了常用的boosting算法的一些区别,从AdaBoost到LightGBM,包括AdaBoost,GBDT,XGBoost,LightGBM四个模型的简单介绍,一步一步从原理到优化对比。AdaBoost原理原始的AdaBoost算法是在算法开始的时候,为每一个样本赋上一个权重值,初始的时候,大家都是一样重要的。在每一步训练中得到的模型,会使得数据点的估计有...
2018-06-21 20:57:44 4314 1
原创 LeetCode#102. 二叉树的层次遍历
给定一个二叉树,返回其按层次遍历的节点值。 (即逐层地,从左到右访问所有节点)。例如:给定二叉树: [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7返回其层次遍历结果:[ [3], [9,20], [15,7]]解题思路:因为输出不是简单的打印出节点内容,需要输出到二维数组中。因此,对队列要进行一下加工,...
2018-06-20 22:17:29 215
原创 二叉树的前序、中序、后序遍历—迭代方式
leetcode上的相关题目:前序:https://leetcode.com/problems/binary-tree-preorder-traversal/?tab=Description中序:https://leetcode.com/problems/binary-tree-inorder-traversal/?tab=Description后序:https://leetcode.com/pr...
2018-06-20 21:36:40 391
原创 LeetCode#661. 图片平滑器
包含整数的二维矩阵 M 表示一个图片的灰度。你需要设计一个平滑器来让每一个单元的灰度成为平均灰度 (向下舍入) ,平均灰度的计算是周围的8个单元和它本身的值求平均,如果周围的单元格不足八个,则尽可能多的利用它们。示例 1:输入:[[1,1,1], [1,0,1], [1,1,1]]输出:[[0, 0, 0], [0, 0, 0], [0, 0, 0]]解释:对于点 (0,0), ...
2018-06-19 23:00:35 565
原创 LeetCode#9. 回文数
判断一个整数是否是回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。示例 1:输入: 121输出: true示例 2:输入: -121输出: false解释: 从左向右读, 为 -121 。 从右向左读, 为 121- 。因此它不是一个回文数。示例 3:输入: 10输出: false解释: 从右向左读, 为 01 。因此它不是一个回文数。进阶:你能不将整数转为字...
2018-06-19 22:44:27 113
原创 Leetcode#347. 前K个高频元素
给定一个非空的整数数组,返回其中出现频率前 k 高的元素。例如,给定数组 [1,1,1,2,2,3] , 和 k = 2,返回 [1,2]。注意:你可以假设给定的 k 总是合理的,1 ≤ k ≤ 数组中不相同的元素的个数。你的算法的时间复杂度必须优于 O(n log n) , n 是数组的大小。解题思路:先用hash方式统计每个数字的出现频率,而后建立一个长度为k的优先队列(小顶堆),保留出现频率...
2018-06-19 21:34:59 726 1
原创 LeetCode#3. 无重复字符的最长子串
给定一个字符串,找出不含有重复字符的最长子串的长度。示例:给定 "abcabcbb" ,没有重复字符的最长子串是 "abc" ,那么长度就是3。给定 "bbbbb" ,最长的子串就是 "b" ,长度是1。给定 "pwwkew" ,最长子串是 "wke" ,长度是3。请注意答案必须是一个子串,"pwke" 是 子序列 而不是子串。解题思路:可变滑动窗记录当前子串的长度,
2018-06-19 17:02:03 126
原创 STL之std::set、std::map的lower_bound和upper_bound
map<int,int> m;int x=14;map<int,int>::iterator iter;iter=m.lower_bound(x);//返回比第一个大于或等于x的值的位置,当m为空时,返回m.begin()iter=m.upper_bound(x);//返回比最后一个大于或等于x的值的位置...
2018-06-19 14:48:32 297
转载 Python Numpy中reshape函数参数-1的含义
原文链接:点击打开链接新数组的shape属性应该要与原来数组的一致,即新数组元素数量与原数组元素数量要相等。一个参数为-1时,那么reshape函数会根据另一个参数的维度计算出数组的另外一个shape属性值。下面来举几个例子来理解一下:>>> z = np.array([[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12],[13, 14, 15, ...
2018-06-16 11:27:39 1535
转载 Pandas对DataFrame单列/多列进行运算(map, apply, transform, agg)
原文链接:点击打开链接 1.单列运算在Pandas中,DataFrame的一列就是一个Series, 可以通过map来对一列进行操作:[python] view plain copydf['col2'] = df['col1'].map(lambda x: x**2) 其中lambda函数中的x代表当前元素。可以使用另外的函数来代替lambda函数,例如:[python...
2018-06-16 11:18:26 35024
转载 使用Git Bash for Windows
原文链接:点击打开链接本篇体验Git Bash在Windows操作系统上的用法。什么是Bash?是一个Shell环境,Bourne Again Shell的缩写。安装git for windows→ http://git-for-windows.github.io/→ Download,选择一个合适的版本→ 安装→ 安装完后有Git Bash, Git CMD, 和 Git GUI这个三个应用程序...
2018-06-15 15:43:15 549
转载 windows下Git BASH安装
下载安装1.从git官网下载一个git安装包,官网下载地址http://www.git-scm.com/download/2.双击安装程序,进入欢迎界面点击【Next >】3.阅读协议,点击【Next >】4.选择安装位置,点击【Next >】5.选择安装组件:这里可以使用默认选项,点击【Next >】图标组件(Additional icons):选择是否创建桌面快捷方式桌...
2018-06-15 15:42:08 178
转载 排序算法之优先级队列与堆排序
原文链接:点击打开链接 在很多应用中,我们通常需要按照优先级情况对待处理对象进行处理,比如首先处理优先级最高的对象,然后处理次高的对象。最简单的一个例子就是,在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话。在这种情况下,我们的数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue) 。...
2018-06-13 16:12:49 3375
原创 OpenCV的CascadeClassifier
加载方式:face_cascade = cv2.CascadeClassifier(r'face_detector\haarcascade_frontalface_default.xml')gray =cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)faces =face_cascade.detectMultiScale(gray,1.1,5,cv2.CASCADE_...
2018-06-11 22:32:34 1807
转载 给出了一个n*n的矩形,编程求从左上角到右下角的路径数(n > =2)
原文链接:点击打开链接给出了一个n*n的矩形,编程求从左上角到右下角的路径数(n > =2),限制只能向右或向下移动,不能回退。例如当n=2时,有6条路径。解:一是利用数学知识,从左上角到右下角总共要走2n步,其中横向要走n步,所以总共就是C2n~n。二是利用递归实现int getTotalPath(int m, int n) { if(m == 1) ...
2018-06-11 17:41:39 2594
转载 dlib window64 py36 whl 安装包下载
无需编译,直接安装whl包省心。https://pypi.python.org/pypi/dlib/19.6.0 下载 dlib-19.6.0-cp36-cp36m-win_amd64.whl 成功安装 dlib 但是import失败 之后尝试 pip install dlib==19.6.1 成功解决https://pypi.python.org/pypi/dlib/19.4.0 下载 dlib...
2018-06-11 16:26:07 1593
转载 Python-pip安装库提示UnicodeDecodeError错误
原文链接:点击打开链接问题描述: Win10系统(家庭中文版)在Windows Powershell(管理员)环境下使用pip安装keras提示UnicodeDecodeError错误解决方法:1、进入Windows Powershell2、输入命令CHCP,查看“当前代码页”(由于系统为预装的Windows 10 家庭中文版,“当前代码页”为936,简体中文)3、输入CHCP 65001,修改“...
2018-06-11 15:39:59 955
原创 window 下总是object_detection/protos/*.proto: No such file or directory
这是因为目前的protoc3.5有Bug,换成3.4就好了https://github.com/google/protobuf/releases/tag/v3.4.0另外,记录一个有关“Win7配置和运行TensorFlow:Object_Detection_API步骤”参考链接点击打开链接...
2018-06-11 15:15:24 1191
转载 人脸识别经典算法一:特征脸方法(Eigenface)
原文链接:点击打开链接这篇文章是撸主要介绍人脸识别经典方法的第一篇,后续会有其他方法更新。特征脸方法基本是将人脸识别推向真正可用的第一种方法,了解一下还是很有必要的。特征脸用到的理论基础PCA在另一篇博客里:特征脸(Eigenface)理论基础-PCA(主成分分析法) 。本文的参考资料附在最后了^_^步骤一:获取包含M张人脸图像的集合S。在我们的例子里有25张人脸图像(虽然是25个不同人的人脸的图...
2018-06-11 09:13:33 33388 1
转载 一篇文章搞懂人脸识别的十个概念
原文链接:点击打开链接实验室研究人脸技术多年,不仅在技术方面有很好的积累,而且在公司内外的业务中有众多应用。在与产品、商务、工程开发同事交流过程中发现:不管是“从图中找到人脸的位置”,或是“识别出这个人脸对应的身份”,亦或是其他,大家都会把这些不同的人脸技术统称为“人脸识别技术”。因此,整理了一些常见人脸技术的基本概念,主要用于帮助非基础研究同事对人脸相关技术有一个更深入的了解,方便后续的交流与合...
2018-06-11 09:10:21 1310
转载 目标检测的图像特征提取之(三)Haar特征
原文链接:目标检测的图像特征提取之(三)Haar特征目标检测的图像特征提取之(三)Haar特征1、Haar-like特征 Haar-like特征最早是由Papageorgiou等应用于人脸表示,Viola和Jones在此基础上,使用3种类型4种形式的特征。Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值...
2018-06-05 15:18:08 273
转载 目标检测的图像特征提取之(二)LBP特征
原文链接:目标检测的图像特征提取之(二)LBP特征目标检测的图像特征提取之(二)LBP特征 LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen, 和 D. Harwood 在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹理特征; ...
2018-06-05 15:14:04 219
转载 目标检测的图像特征提取之(一)HOG特征
原文链接:图像特征提取三大法宝:HOG特征,LBP特征,Haar特征(一)HOG特征1、HOG特征:方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要...
2018-06-05 11:43:40 242
原创 softmax相关概念
前言:很早在神经网络那里知识的时候知道,在多分类任务中,最后一层全连接层会用softmax层处理输出的y值,将输出变成一个概率分布,又说道在这里用交叉熵作为代价函数,,,,,,总之,就是概念混乱导致的一头雾水,看了好久也是云里雾里,后来终于看西瓜书仔细推导了一遍逻辑回归的公式,才似乎明白了,今天发现softmax回归这个东西,才算是有点小明白了(还不到大明白)。一下是copy来的正文(其中加了一些...
2018-06-02 16:52:27 2317 2
python安装包basemap-1.2.1-cp37-cp37m-win_amd64.whl
2020-05-21
talkingdata-mobile-user-demographics.zip
2020-05-20
PoiMap.zip
2020-04-21
TMDB 5000 Movie Dataset
2018-10-15
人工智能产品经理
2018-07-20
2017全球人工智能人才白皮书
2018-07-20
Python项目开发实战(第2版)带标签
2018-07-20
fer2013人脸表情识别数据集
2018-06-24
剑指offer完整版PDF带目录源码(C++和Java版)
2018-01-20
Python数据分析与挖掘实战pdf带标签+源代码
2018-01-09
pandas API英文版(20171212版)
2018-01-05
利用Python进行数据分析pdf中文完整带目录+源代码(py和ipynb)
2018-01-05
titanic_dataset.csv(泰坦尼克数据集)
2018-01-05
Learning Jupyter 英文高清完整带标签(pdf版和epub版)下载
2018-01-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人