CSDN博客积分规则

1、博客积分规则      博客积分是CSDN对用户努力的认可和奖励,也是衡量博客水平的重要标准。博客等级也将由博客积分唯一决定。积分规则具体如下: 每发布一篇原创或者翻译文章:可获得10分; 每发布一篇转载文章:可获得2分; 博主的文章每被评论一次:可获得1分; 每发表一次评论:可获得1分(自己给自己评论、博主回复评论不获得积分); 博文阅读次数每超过100次:可获得1分,阅读加分最高加到100分...
阅读(905) 评论(10)

[置顶] Isolation Forest算法实现详解

本文算法完整实现源码已开源至本人的GitHub(如果对你有帮助,请给一个 star ),参看其中的 iforest 包下的 IForest 和 ITree 两个类: https://github.com/JeemyJohn/AnomalyDetection前言       本文介绍的 Isolation Forest 算法原理请参看我的博客:Isolation Forest异常检测算法原理详解,本文...
阅读(2637) 评论(12)

[置顶] Isolation Forest算法原理详解

本文只介绍原论文中的 Isolation Forest 孤立点检测算法的原理,实际的代码实现详解请参照我的另一篇博客:Isolation Forest算法实现详解。       或者读者可以到我的GitHub上去下载完整的项目源码以及测试代码(源代码程序是基于maven构建): https://github.com/JeemyJohn/AnomalyDetection。前言       随着机器学习...
阅读(4044) 评论(24)

Win10 64bit下安装GPU版Tensorflow+Keras

Tensorflow和Keras都是支持Python接口的,所以本文中说的都是搭建一个Python的深度学习环境。        Keras是对Tensorflow或者Theano的再次封装,也就是以Tensorflow或Theano为后端,默认的后端是tensorflow,如果你想使用theano为后端,可以更改为theano。Keras为什么要对tensorflow和theano进行再次封装,当...
阅读(1368) 评论(11)

[置顶] 机器学习中的数据不平衡解决方案大全

在机器学习任务中,我们经常会遇到这种困扰:数据不平衡问题。       数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。       本文介绍几种有效的解决数据不平衡情况下有效训练有监督算法的思路:1、重新采样训练集...
阅读(18699) 评论(38)

Jedis操作Redis技巧详解

对于Redis的部署模式有两种,单机模式 和 集群模式。因此,本文的介绍也从这两个方面进行介绍。众所周知,Jedis是最著名的Redis java客户端操作类库,几乎支持所有的Redis操作。本文就是要介绍Jedis API如何操作两种模式下的Redis数据库,以及相关的操作技巧。      本文介绍的全都是基于maven的管理方式建立的Java项目。首先,为了Java程序中使用Jedis API,...
阅读(1358) 评论(14)

程序化广告欺诈流量过滤方法

打击虚假流量需各方携手,解决流量欺诈问题仅依靠广告验证是远远不够的,广告验证能够帮助广告主和行业指出问题所在,还需要供应链上的各方共同努力,携手打造反作弊生态圈。1、DSP(需求方平台,Demand-Side Platform)       DSP作为需求方平台,要真正站在广告主的需求和利益角度,从技术、数据、算法和团队四个维度出发,对作弊流量、问题流量和可疑流量进行主动屏蔽和过滤;在此基础上,形成...
阅读(659) 评论(2)

[置顶] TensorFlow官网访问不了

下面的方案已经行不通了,原因你们猜!直接访问: https://tensorflow.google.cn 对机器学习感兴趣的小伙伴请关注微信公众号:燕哥带你学算法        相信很多搞深度学习的小伙伴最近都为访问不了 TensorFlow官网 而苦恼吧!虽然网上也给出了一些方法,但是却缺少一个很重要的步骤。接下来,我就给大家讲解一个完整的过程,大牛绕过。1、更改Hosts      在...
阅读(5079) 评论(7)

BP神经网络的原理及推导

首先什么是人工神经网络?简单来说就是将单个感知器作为一个神经网络节点,然后用此类节点组成一个层次网络结构,我们称此网络即为人工神经网络(本人自己的理解)。当网络的层次大于等于3层(输入层+隐藏层(大于等于1)+输出层)时,我们称之为多层人工神经网络。1、神经单元的选择       那么我们应该使用什么样的感知器来作为神经网络节点呢?在上一篇文章我们介绍过感知器算法,但是直接使用的话会存在以下问题:感...
阅读(966) 评论(8)

机器学习中Bagging和Boosting的区别

Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。       首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。1. Bagging (bootstrap aggregating)Bagging即套袋法,其算法过程如下: 从原...
阅读(1361) 评论(15)

[置顶] IDEA、PyCharm激活服务器地址

在License server中输入:http://btsha.com:41017 对机器学习,人工智能感兴趣的小伙伴,请关注我的公众号:...
阅读(2267) 评论(4)

Sample K算法

最近去国内某牛叉互联网公司面试,出了一道算法题,看似简单,但是真正的答案十分巧妙。故此回忆并将原题以及解题思路记录下来,供大家学习: 随机的选取容量为N的数组中的k个元素,要求是不能重复选取,并且不能删除数组中的元素,只能够进行交换。 1. 解题思路                   今天就写到这,谁有好的解题方法请提出了共同学习。我这里明天继续……2. 贴上源码(Java)...
阅读(783) 评论(6)

[置顶] 深度神经网络训练的必知技巧

本文主要介绍8种实现细节的技巧或tricks:数据增广、图像预处理、网络初始化、训练过程中的技巧、激活函数的选择、不同正则化方法、来自于数据的洞察、集成多个深度网络的方法。1. 数据增广       在不改变图像类别的情况下,增加数据量,能提高模型的泛化能力。      自然图像的数据增广方式包括很多,如常用的水平翻转(horizontally flipping),一定程度的位移或者裁剪和颜色抖动...
阅读(6483) 评论(34)

Windows下安装Scikit-Learn

用Python做机器学习,最常用的库就是scikit-learn。接下来,我就介绍一下如何在Windows中安装并成功运行scikit-learn。1. 安装Python       首先,我们需要安装Python环境。本人选择的是64位版本的Python 3.5。去Python官网https://www.python.org/选择相应的版本并下载。如下如所示:接下来安装,并最终选择将Python加...
阅读(1252) 评论(12)

Spring读取配置文件

完整的程序请参看: https://github.com/JeemyJohn/ReadConfigProperties.git 1. 添加Spring依赖2. 在resources目录下创建配置文件创建如下所示的config.properties文件: 接下来在config.properties 文件中添加配置属性并对相应的赋值 :3. 创建一个Spring Bean 自动读取相关属性创建一个S...
阅读(797) 评论(5)

Spark写ES的遇到的坑

由于项目需要,最近搞Spark Streaming做数据分析,并最终将分析完的数据写入ElasticSearch。我们项目使用的是Spark 2.1.0,而我们公司的ElasticSearch版本使用的是2.1.2。项目过程中遇到了很多坑,浪费了不少时间,故此在这里总结一下,希望大家以后免于趟这些坑以节约时间做一些更有意义的事。由于Maven依赖很长,故此放在最后,请参看: 添加Maven依赖1....
阅读(2717) 评论(5)

MNIST手写字识别的TensorFlow实现

1. 简介       本文介绍的是MNIST手写字体CNN识别模型的TensorFlow的实现。据本人亲自测试,当迭代训练次数为20000时能在验证集上取得最高的准确率。当迭代训练次数达到28000次之后,模型识别准确率骤降,至于原因本人后续研究解释。2. 完整源码实现from tensorflow.examples.tutorials.mnist import input_data import...
阅读(603) 评论(4)

AlexNet 的tensorflow 实现

本文转载自 http://blog.csdn.net/chenriwei2/article/details/50615753# 输入数据 import input_data mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)import tensorflow as tf# 定义网络超参数 learning_rate = 0.00...
阅读(479) 评论(4)

Scala解析Json字符串

1. 添加相应依赖       Json解析工具使用的 json-smart,曾经对比过Java的fastjson、gson。Scala的json4s、lift-json。其中 json-smart 解析速度是最快的。 net.minidev json-...
阅读(1359) 评论(4)

CentOS端口重定向

1. CentOS下配置端口转发 将80端口请求转发至8080 在root账户下面运行一下命令:iptables -t nat -A PREROUTING -p tcp --dport 80 -j REDIRECT --to-port 8080另外如果防火墙重新启动,该命令就会失效,可以使用下面的命令把该规则保存到iptables里面。service iptables save...
阅读(371) 评论(4)
93条 共5页首页 上一页 1 2 3 4 5 ... 下一页 尾页
    我的公众号

    关注微信公众号,专

    为机器学习入门者
    个人资料
    • 访问:144523次
    • 积分:3302
    • 等级:
    • 排名:第10715名
    • 原创:83篇
    • 转载:6篇
    • 译文:4篇
    • 评论:760条
    博客专栏
    最新评论