程序化广告欺诈流量过滤方法

打击虚假流量需各方携手,解决流量欺诈问题仅依靠广告验证是远远不够的,广告验证能够帮助广告主和行业指出问题所在,还需要供应链上的各方共同努力,携手打造反作弊生态圈。1、DSP(需求方平台,Demand-Side Platform)       DSP作为需求方平台,要真正站在广告主的需求和利益角度,从技术、数据、算法和团队四个维度出发,对作弊流量、问题流量和可疑流量进行主动屏蔽和过滤;在此基础上,形成...
阅读(435) 评论(2)

TensorFlow官网访问不了

相信很多搞深度学习的小伙伴最近都为访问不了 TensorFlow官网 而苦恼吧!虽然网上也给出了一些方法,但是却缺少一个很重要的步骤。接下来,我就给大家讲解一个完整的过程,大牛绕过。1、更改Hosts      在Windows的host文件(位置在C:\Windows\System32\drivers\etc\hosts)末尾添加如下内容:#TensorFlow start 64.233.188...
阅读(1967) 评论(3)

BP神经网络的原理及推导

首先什么是人工神经网络?简单来说就是将单个感知器作为一个神经网络节点,然后用此类节点组成一个层次网络结构,我们称此网络即为人工神经网络(本人自己的理解)。当网络的层次大于等于3层(输入层+隐藏层(大于等于1)+输出层)时,我们称之为多层人工神经网络。1、神经单元的选择       那么我们应该使用什么样的感知器来作为神经网络节点呢?在上一篇文章我们介绍过感知器算法,但是直接使用的话会存在以下问题:感...
阅读(624) 评论(8)

机器学习中Bagging和Boosting的区别

Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。       首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。1. Bagging (bootstrap aggregating)Bagging即套袋法,其算法过程如下: 从原...
阅读(671) 评论(15)

IDEA激活服务器地址

http://idea.iteblog.com/key.php...
阅读(966) 评论(4)

Sample K算法

最近去国内某牛叉互联网公司面试,出了一道算法题,看似简单,但是真正的答案十分巧妙。故此回忆并将原题以及解题思路记录下来,供大家学习: 随机的选取容量为N的数组中的k个元素,要求是不能重复选取,并且不能删除数组中的元素,只能够进行交换。 1. 解题思路                   今天就写到这,谁有好的解题方法请提出了共同学习。我这里明天继续……2. 贴上源码(Java)...
阅读(594) 评论(6)

深度神经网络训练的必知技巧

本文主要介绍8种实现细节的技巧或tricks:数据增广、图像预处理、网络初始化、训练过程中的技巧、激活函数的选择、不同正则化方法、来自于数据的洞察、集成多个深度网络的方法。1. 数据增广       在不改变图像类别的情况下,增加数据量,能提高模型的泛化能力。      自然图像的数据增广方式包括很多,如常用的水平翻转(horizontally flipping),一定程度的位移或者裁剪和颜色抖动...
阅读(5625) 评论(34)

Windows下安装Scikit-Learn

用Python做机器学习,最常用的库就是scikit-learn。接下来,我就介绍一下如何在Windows中安装并成功运行scikit-learn。1. 安装Python       首先,我们需要安装Python环境。本人选择的是64位版本的Python 3.5。去Python官网https://www.python.org/选择相应的版本并下载。如下如所示:接下来安装,并最终选择将Python加...
阅读(923) 评论(12)

Spring读取配置文件

完整的程序请参看: https://github.com/JeemyJohn/ReadConfigProperties.git 1. 添加Spring依赖2. 在resources目录下创建配置文件创建如下所示的config.properties文件: 接下来在config.properties 文件中添加配置属性并对相应的赋值 :3. 创建一个Spring Bean 自动读取相关属性创建一个S...
阅读(603) 评论(5)

Spark写ES的遇到的坑

由于项目需要,最近搞Spark Streaming做数据分析,并最终将分析完的数据写入ElasticSearch。我们项目使用的是Spark 2.1.0,而我们公司的ElasticSearch版本使用的是2.1.2。项目过程中遇到了很多坑,浪费了不少时间,故此在这里总结一下,希望大家以后免于趟这些坑以节约时间做一些更有意义的事。由于Maven依赖很长,故此放在最后,请参看: 添加Maven依赖1....
阅读(1640) 评论(5)

MNIST手写字识别的TensorFlow实现

1. 简介       本文介绍的是MNIST手写字体CNN识别模型的TensorFlow的实现。据本人亲自测试,当迭代训练次数为20000时能在验证集上取得最高的准确率。当迭代训练次数达到28000次之后,模型识别准确率骤降,至于原因本人后续研究解释。2. 完整源码实现from tensorflow.examples.tutorials.mnist import input_data import...
阅读(386) 评论(4)

AlexNet 的tensorflow 实现

本文转载自 http://blog.csdn.net/chenriwei2/article/details/50615753# 输入数据 import input_data mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)import tensorflow as tf# 定义网络超参数 learning_rate = 0.00...
阅读(314) 评论(4)

Scala解析Json字符串

1. 添加相应依赖       Json解析工具使用的 json-smart,曾经对比过Java的fastjson、gson。Scala的json4s、lift-json。其中 json-smart 解析速度是最快的。 net.minidev json-...
阅读(668) 评论(4)

CentOS端口重定向

1. CentOS下配置端口转发 将80端口请求转发至8080 在root账户下面运行一下命令:iptables -t nat -A PREROUTING -p tcp --dport 80 -j REDIRECT --to-port 8080另外如果防火墙重新启动,该命令就会失效,可以使用下面的命令把该规则保存到iptables里面。service iptables save...
阅读(276) 评论(4)

Linux免密码远程登录

如何通过一台linux ssh远程其他linux服务器时,不要输入密码,可以自动登入。提高远程效率,不用记忆各台服务器的密码。1. 首先登入一台linux服务器,此台做为母机(即登入其他linux系统用这台做为入口);执行一行命令生成key文件:ssh-keygen -t rsa ,然后一直回车,如下所示:2. 在母机上,进入/root/.ssh目录,找到id_rsa.pub该文件,这个文件就是...
阅读(283) 评论(4)
82条 共6页首页 上一页 1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:97825次
    • 积分:2723
    • 等级:
    • 排名:第13257名
    • 原创:72篇
    • 转载:6篇
    • 译文:4篇
    • 评论:722条
    我的公众号

    博客专栏
    最新评论