自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

转载 爬虫程序加入动态代理

转载于:https://my.oschina.net/u/3121322/blog/827006

2017-01-18 12:00:00 98

转载 linux环境下mysql数据库的编码问题

linux下则需要修改/etc/my.cnf,在[mysqld]下加入default-character-set = utf8,[client]下加入default-character-set = utf8,在[mysql]字段里加入default-character-set=utf8 实现...

2016-12-19 10:06:00 116

转载 常用算法总结

朴素贝叶斯:   有以下几个地方需要注意:   1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单词出现的次数。   2. 计算公式如下:      其中一项条件概率可以通过朴素贝...

2016-12-16 19:01:00 147

转载 寿险客户信息分析(随机森林算法实例)

目标: 个险客户特征分析 背景: 目前市场部使用的推广活动分析系统只能针对客户调查返回的信息分析,且仅有年龄/性别/婚姻状态/收入四个维度, 预测精度不高. 市场部希望能从现有的寿险客户信息分析出影响他们选择保险产品的关键因素, 借此更有针对性地改进市场推广活动 ...

2016-12-16 18:59:00 396

转载 机器学习中碰到的距离汇总

1. 欧氏距离(EuclideanDistance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。 (1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离: (2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧...

2016-12-16 17:21:00 101

转载 随机森林算法详解(当下最好的算法之一)

1. 随机森林使用背景 1.1 随机森林定义 随机森林是一种比较新的机器学习模型。经典的机器学习模型是神经网络,有半个多世纪的历史了。神经网络预测精确,但是计算量很大。上世纪八十年代Breiman等人发明分类树的算法(Breiman et al. 1984),通过反复二分数据进行分类或回归...

2016-12-15 19:47:00 4066

转载 决策树算法解析

算法原理 决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数有两大优点:1)决策树模型可以读性好,具有描述性,有助于人工分析;2)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度...

2016-12-13 09:36:00 657

转载 linux系统的时间同步

NTP服务及时间同步(CentOS6.3) 目标环境,3台linux centos 6.3, 一台作为NTPD服务与外部公共NTP服务同步时间,同时作为内网的NTPD服务器,其他机器与这台服务做时间同步。 1、安装配置 CentOS 6.3系统已经自带了NTPD服务,一般...

2016-12-10 14:49:00 113

转载 ELK对Nginx日志进行分析

一、整体架构 二、整体概述: 从上图可以看出,日志首先被收集到redis当中,进行缓冲,再通过logstash收集到elasticsearch集群进行索引创建,根据需求进行维度上的组合,最后kibana实现elasticsearch的restful风格接...

2016-12-09 17:49:00 192

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除