- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 特征工程
特征工程定义特征:从原始数据中抽取出来的对预测结果有用的数据特征工程:用专业的技巧和方法从原始数据中挖掘有用特征(对预测结果有帮助的特征)的过程意义更好的特征意味着只需要简单的模型更好的特征意味着更好的结果特点听起来高大上:机器学习比赛中特征工程比较有用资料比较少:跟业务和场景有关过程从hdfs或者hbase中拉原始数据进行数据清洗、数据标准化、数据采样(正负样本...
2019-06-23 14:05:31 146
原创 逻辑回归算法LR
逻辑回归算法LR逻辑回归相信很多人都很熟悉,这个算法科能不如随机森林、SVM、神经网络、GBDT等分类算法那么复杂那么高深,但是绝不能小瞧这个算法,因为这个这个算法有几个优点是那几个算法无法达到的,一是逻辑回归算法已经比较成熟,预测较为准确;二是模型求出的系数易于理解,便于解释,不属于黑盒模型,尤其在金融业,80%的预测是使用逻辑回归;三是结果是概率值,可以做ranking model; 四是训...
2019-06-21 18:00:32 632
翻译 异常检测iforest算法介绍
异常检测算法iforest异常检测介绍异常检测又被称为是“离群点检测”,是机器学习领域跟现实紧密联系的、有广泛需求的一类问题。如网络安全中的攻击检测和流量异常分析,金融机构则用于挖掘出欺诈行为。什么是异常,并没有标准答案,通常因具体应用场景而异。通常异常有两个假说:1)异常数据跟样本中大多数数据不太一样;2)异常数据在整体样本中占的比例较小。对于异常检测而言,最直接的做法是利用各种统...
2019-06-19 17:51:00 6355 3
原创 xgboost算法原理
xgboost算法原理1.xgboost的介绍xgboost的全称(extreme gradient boosting)极限梯度提升,经常被用在一些比赛中,其效果显著。它是大规模并行boosted tree 的工具,是目前最快最好的开源Boosted tree工具包。xgboost所应用的算法是gbdt(gradient boosting decision tree)的改进,既可以用于分类也可...
2019-06-16 16:13:15 4767 2
原创 xgboost算法的原理
xgboost算法原理:boosting方法的回归思想boosting方法:把多个弱学习器的结果结合起来得到最终结果回归思想:把每个弱学习器的输出结果当做连续值,这样,可以对每个弱学习器的结果进行累加处理,且能够更好的利用损失函数来优化模型集成学习法加法模型小结:Boosting方法把每个弱学习器的输出看成是连续值,使得损失函数是个连续值,因此可以通过弱学习器的迭代达到优化模型的目的,这...
2019-06-13 20:47:13 260
原创 xgboost算法调参
xgboost算法调参XGBoost的作者把所有的参数分成了三类:一、 通用参数:宏观函数控制。1)、booster[默认gbtree]选择每次迭代的模型,有两种选择:gbtree:基于树的模型gbliner:线性模型2)、silent[默认0]当这个参数值为1时,静默模式开启,不会输出任何信息。一般这个参数就保持默认的0,因为这样能帮我们更好地理解模型。3)、nthread[...
2019-06-13 19:55:23 509
原创 xgboost调参:最佳迭代次数
xgboost调参:最佳迭代次数说明:xgboost有一个很有用的函数“cv”,这个函数可以在每一次迭代中使用交叉验证,并返回理想的决策树数量。#coding:utf-8from __future__ import divisionimport sysimport pandas as pdimport xgboost as xgbfrom numpy import loadtxt...
2019-06-13 19:35:09 6836 1
原创 xgboost算法使用grid_search 来调参
xgboost算法调参#coding:utf-8from __future__ import divisionimport sysimport pandas as pdimport xgboost as xgbfrom numpy import loadtxtfrom xgboost import XGBClassifierfrom sklearn.model_selection ...
2019-06-13 19:24:07 3053
原创 python 正则匹配
代码:#coding:utf-8import sysimport restr_1 = "sudo(19178)───sh(19179)───sh(19182)───sh(19185)───sleep(19188)"re_key = re.compile("sudo\((\d+)\)───sh\((\d+)\)───sh\((\d+)\)───sh\((\d+)\)───sleep\((...
2019-06-05 16:03:53 688
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人