自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

学习AI算法,请关注微信公众号:机器学习算法全栈工程师……

对机器学习,深度学习QQ群:252682362。注明自己是机器学习爱好者!

原创 Isolation Forest算法实现详解

本文算法完整实现源码已开源至本人的GitHub(如果对你有帮助,请给一个 star ),参看其中的 iforest 包下的 IForest 和 ITree 两个类: https://github.com/JeemyJohn/AnomalyDetection前言       本文介绍的 Isolat...

2017-06-26 22:32:29 11835 20

原创 Isolation Forest算法原理详解

本文只介绍原论文中的 Isolation Forest 孤立点检测算法的原理,实际的代码实现详解请参照我的另一篇博客:Isolation Forest算法实现详解。       或者读者可以到我的GitHub上去下载完整的项目源码以及测试代码(源代码程序是基于maven构建): https://g...

2017-06-18 18:39:18 26396 33

原创 面试题—有重复序列全排列问题

最近面试遇到个高频面试题:有重复序列全排列问题,现在Java代码展示给大家,原理稍后有空补充。 public class Demo { public static void main(String[] args) { char a1[] = {'a', ...

2020-03-05 12:34:59 106 0

原创 面试题—三个数之和小于某个值的组合个数

本题是阿里蚂蚁金服面试题: 给定一个数组s,和一个数a,在数组s里面找到3个数使这3个数的和小于a,即s[i]+s[j]+s[k]<a,请你设计一个函数返回数组s里这样的组合有多少个? int f(double s[], double a) { int cnt = 0;...

2020-03-05 11:57:15 84 0

原创 Python计算相关性

计算相关性 import numpy as np import pandas as pd # load data data = pd.read_csv('result.csv', header=0) print(data) df = data.drop(['exp...

2018-11-14 14:35:48 1017 0

原创 实战微课:机器学习在推荐系统中的应用-章华燕-专题视频课程

在机器学习领域,“没有免费的午餐”是一个不变的定理。简而言之,没有一种算法是完美的,可以作为任何问题的佳解决方案。本课程后通过完整的大型项目,帮助学员从 构建数据集、特征选择 、模型调参 、模型评估与验证 一步步掌握机器学习项目开发的完整流程,同时能够完整地学习到推荐系统的相关基础知识。...

2018-07-27 15:51:30 418 0

原创 机器学习小咖养成记视频教程-章华燕-专题视频课程

本视频课程是机器学习算法入门的升级课程。从机器学习、深度学习基础入手,以模型为基础,以算法与数学推导为核心,以算法调参与应用为导向。通过对机器学习中几个经典核心算法:朴素贝叶斯、逻辑回归、决策树、集成学习算法、聚类算法、神经网络、SVM等从而帮助学员彻底理解每个模型的运行原理与效果。后通过完整的大...

2018-06-20 15:43:31 255 0

原创 机器学习路线-章华燕-专题视频课程

机器学习路线: 机器学习能做什么; 机器学习有哪些方向; 怎么入门和转行机器学习; 怎么入门和转行机器学习; 人脸识别技术的漏洞; 高光谱图像技术的原理; 应用高光谱与机器学习区分真人和照片...

2018-06-01 17:39:08 374 0

原创 机器学习核心算法各个击破

0. 前言   近年来,随着 Google 的 AlphaGo 打败韩国围棋棋手李世乭之后,机器学习尤其是深度学习的热潮席卷了整个IT界。所有的互联网公司,尤其是 Google 微软,百度,腾讯等巨头,无不在布局人工智能技术和市场。百度,腾讯,阿里巴巴,京东,等互联网巨头甚至都在美国硅谷大肆高薪...

2018-04-28 20:08:20 1066 0

原创 LightGBM大战XGBoost,谁将夺得桂冠?

0.引言   如果你是一个机器学习社区的活跃成员,你一定知道 提升机器(Boosting Machine)以及它们的能力。提升机器从AdaBoost发展到目前最流行的XGBoost。XGBoost实际上已经成为赢得在Kaggle比赛中公认的算法。这很简单,因为他极其强大。但是,如果数据量极其的大...

2018-04-13 15:36:45 2185 5

原创 Vim实战技巧锦集

1、VIM的概念和基础操作 vi 命令行下面的文本编辑工具,vim是vi的增强版本。命令vim可以启动vim编辑器。一般可以通过vim+目标文件路径的形式使用vim。如果目标文件存在,则vim打开该文件;若目标文件不存在,则新建该文件。 1.1 VI拥有三种模式:命令模式、插入模式和ex模式 ...

2018-02-12 11:54:49 377 0

原创 Spark资源调优

Spark作者:章华燕                编辑:龚    赛概述1        在开发完Spark作业之后,就该为作业配置合适的资源了。Spark的资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置这些...

2018-01-08 00:00:00 564 0

原创 CNN模型之ShuffleNet

CNN作者:叶 虎                编辑:李文臣引言1        ShuffleNet是旷视科技最近提出的一种计算高效的CNN模型,其和MobileNet和SqueezeNet等一样主要是想应用在移动端。所以,ShuffleNet的设计目标也是如何利用有限的计算资源来达到最好的模...

2018-01-03 00:00:00 2051 0

原创 系列学习——推荐算法综述

作者:章华燕                编辑:祝鑫泉前言1随着移动互联网技术和社交网络的发展,每天都有大量包括博客,图片,视频,微博等等的信息发布到网上。我们正处于大数据的时代,传统的信息检索技术已经不能满足用户对信息发现的需求,推荐引擎的出现,可以帮用户获取更丰富,更符合个人口味和更加有意义...

2018-01-01 00:00:00 2288 0

原创 浅析深度学习在实体识别和关系抽取中的应用

实体识别作者:蒙    康                编辑:黄俊嘉命名实体识别1命名实体识别(Named Entity Recognition,NER)就是从一段自然语言文本中找出相关实体,并标注出其位置以及类型,如下图。命名实体识别是NLP领域中的一些复杂任务的基础问题,诸如自动问答,关系抽...

2017-12-31 00:00:00 13211 1

原创 一步步教你理解LSTM

作者:王千发编辑:田 旭什么是LSTM1LSTM全名是Long Short-Term Memory,长短时记忆网络,可以用来处理时序数据,在自然语言处理和语音识别等领域应用广泛。和原始的循环神经网络RNN相比,LSTM解决了RNN的梯度消失问题,可以处理长序列数据,成为当前最流行的RNN变体。LS...

2017-12-29 00:00:00 3050 1

原创 Spark问题集锦

使用外部链接对象(如Jedis客户端)在Streaming RDD中发送数据时,一定要使用单例。否则会出现各种Bug。 在IDEA中使用maven混合Scala和Java打Jar包时,Java的类要写在Java目录里。如果将Java类定义在scala目录下,会出现 NoClassDefFoundE...

2017-12-28 21:36:34 359 0

原创 机器学习实战---线性回归提高篇之乐高玩具套件二手价预测

作者:崔家华     编辑:王抒伟PS(欢迎访问作者个人网站:www.cuijiahua.com)线性回归零前言:本篇文章讲解线性回归的缩减方法,岭回归以及逐步线性回归,同时熟悉sklearn的岭回归使用方法,对乐高玩具套件的二手价格做出预测。一岭回归:如果数据的特征比样本点还多应该怎么办?很显然...

2017-12-24 00:00:00 1547 0

原创 Spark 常见问题解决方案

Spark 常见问题收集,并给出相应的解决方案。分享给大家,希望大家不要走弯路……

2017-12-23 14:40:53 10582 0

原创 Spark资源调优

0. 概述  在开发完Spark作业之后,就该为作业配置合适的资源了。Spark的资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置这些参数,最后就只能胡乱设置,甚至压根儿不设置。资源参数设置的不合理,可能会导致没有...

2017-12-23 13:24:32 1271 0

原创 Spark Streaming之妙用foreachRDD和foreachPartition

0. 前言  DStream中的foreachRDD是一个非常强大函数,它允许你把数据发送给外部系统。因为输出操作实际上是允许外部系统消费转换后的数据,它们触发的实际操作是DStream转换。所以要掌握它,对它要有深入了解。下面有一些常用的错误需要理解。经常写数据到外部系统需要创建一个连接的对象(...

2017-12-20 21:24:24 8953 1

原创 Object Detection系列(三) Fast R-CNN

作者:张   旭编辑:黄俊嘉该内容是目标检测系列的第三篇,系列前部分内容如下,点击可查看:Object Detection系列(一) R-CNN Object Detection系列(二) SPP-Net Fast R-CNN简介在之前的两个文章中,我们分别介绍了R-CNN与SPP-Net,于是在...

2017-12-20 00:00:00 470 0

原创 Git命令之分支操作

1. 查看全部分支$ git branch -a * master remotes/origin/HEAD -> origin/master remotes/origin/master remotes/origin/jeemy2. 查看本地分支$ git branch *...

2017-12-19 19:46:22 535 0

原创 Vim命令总结

不断地总结工作中非常实用的vim命令……

2017-12-19 16:03:59 303 0

原创 你必须要知道CNN模型:ResNet

作者:叶 虎编辑:张   欢PART01 ResNet简介引言深度残差网络(Deep residual network, ResNet)的提出是CNN图像史上的一件里程碑事件,让我们先看一下ResNet在ILSVRC和COCO 2015上的战绩:图1 ResNet在ILSVRC和COCO 2015...

2017-12-18 00:00:00 42699 1

原创 XGBoost 中特征重要性和特征选择原理解析与实战

未完待续…… 对机器学习和人工智能感兴趣,请扫码关注微信公众号!

2017-12-17 23:05:23 6223 0

原创 GAN系列学习(2)——前生今世

作者:刘威威编辑:李文臣       本文是GAN系列学习--前世今生第二篇,在第一篇中主要介绍了GAN的原理部分,在此篇文章中,主要总结了常用的GAN包括DCGAN,WGAN,WGAN-GP,LSGAN-BEGAN的详细原理介绍以及他们对GAN的主要改进,并推荐了一些Github代码复现链接。 ...

2017-12-17 00:00:00 1724 0

原创 从损失函数的角度详解常见机器学习算法(1)

作者:章华燕编辑:赵一帆1、机器学习中常见的损失函数一般来说,我们在进行机器学习任务时,使用的每一个算法都有一个目标函数,算法便是对这个目标函数进行优化,特别是在分类或者回归任务中,便是使用损失函数(Loss Function)作为其目标函数,又称为代价函数(Cost Function)。损失函数...

2017-12-15 00:00:00 1950 0

原创 基于XGBoost的特征选择原理与实战

周末填坑……

2017-12-13 20:34:40 3188 2

原创 Mac开发总结

1. 添加环境变量在这里我以添加maven环境变量为例进行讲解: 我的maven地址为:/Jeemy/apache-maven-3.5.2/bin; 在终端输入命令:sudo vi ~/.bash_profile; 在打开的文件中输入:export PATH=$PATH:/Jeemy/apache...

2017-12-13 12:11:30 274 0

转载 应用TF-Slim快速实现迁移学习

作者:张旭编辑:张欢这是一篇以实践为主的入门文章,目的在于用尽量少的成本组织起来一套可以训练和测试自己的分类任务的代码,其中就会用到迁移学习,TF-Slim库的内容,所以我们分为下面几个步骤介绍::什么是迁移学习;什么是TF-Slim;TF-Slim实现迁移学习的例程;应用自己的数据集完成迁移学习...

2017-12-11 00:00:00 4129 1

转载 GAN系列学习(1)——前生今世

作者:刘威威编辑:李文臣11.GAN的 ‘前世’?大家都知道GAN是Ian Goodfellow 2 014年放出的一篇开山之作,在深度学习界评价很高,可以说GAN的出现,给深度学习界带来了很多的研究(shui)课(lun)题(wen)。但是如果说GAN是另外一种网络的变种,不知道你是否相信呢?但...

2017-12-09 00:00:00 4229 0

转载 Object Detection系列(一)R-FCN

作者:张  旭 编辑:祝鑫泉Object Detection系列(一) R-FCN R-FCN简介上面这张图在这个系列文章中都会出现,可以看到,在时间轴上R-FCN并不应该出现在第五篇中,但是R-FCN在内容上是承接Faster R-CNN的,同样是何凯明团队提出,所以在这里把R-FCN移到了前面...

2017-12-07 00:00:00 438 0

原创 Linux创建定时任务

在Linux下,经常需要定期的执行一些脚本从而来实现一些功能。在Linux下我们用crontab来实现定期的执行脚本这个功能,下面就介绍一下crontab的使用。以及我遇到的一些问题

2017-12-05 22:45:14 450 0

转载 CNN模型之MobileNet

作者:  叶虎       编辑:王抒伟  本文6500字30图,阅读约。。。分钟  算了爱看多久看多久零引言:卷积神经网络(CNN)已经普遍应用在计算机视觉领域,并且已经取得了不错的效果。图1为近几年来CNN在ImageNet竞赛的表现,可以看到为了追求分类准确度,模型深度越来越深,模型复杂度也...

2017-12-05 00:00:00 6496 0

转载 机器学习/深度学习入门资料汇总

作者:刘才权 编辑:栾志勇 经常被同学和朋友询问机器学习或深度学习入门,有哪些不错的参考资料。老实讲,这个问题在网上随便一搜就是一大把的答案。我自己在最开始的时候也有同样的困惑,同样在搜索引擎和论坛里翻找答案。但大多数答案并不怎么让人满意:搜索结果要么星稀零散,只见树木不见森林;...

2017-12-03 00:00:00 4215 0

转载 Object Detection系列(二) SPP-Net

作者:张  旭  编辑:黄俊嘉 该内容是目标检测系列的第二篇,第一篇请移步: Object Detection系列(一) R-CNN  SPP-Net简介 在上一篇R-CNN的文章中,详细介绍了R-CNN算法,同时也说明了R-CNN的致命缺陷,超长的训练时间(84h)和测...

2017-12-01 00:00:00 474 0

原创 基于物品的协同过滤算法

未完待续…… 对机器学习和人工智能感兴趣,请扫码关注微信公众号!

2017-11-30 19:12:37 531 0

原创 基于用户的协同过滤算法详解

0. 前言  基于领域的推荐算法是推荐系统中最基本的算法,此类算法不仅在学术界得到了深入研究,而且在工业界也得到了广泛地应用。基于领域的推荐算法主要分为两大类:一类是基于用户的协同过滤算法(User Based Collaborative Filtering,UserCF);一类是基于物品的协同过...

2017-11-30 19:11:00 1179 0

转载 一文看懂常用的梯度下降算法

作者:叶    虎 编辑:祝鑫泉 一 概述 梯度下降算法(Gradient Descent Optimization)是神经网络模型训练最常用的优化算法。对于深度学习模型,基本都是采用梯度下降算法来进行优化训练的。梯度下降算法背后的原理:目标函数关于参数的梯度将是目标函...

2017-11-29 00:00:00 92952 7

提示
确定要删除当前文章?
取消 删除