- 博客(32)
- 收藏
- 关注
原创 TASK3
1.1 特征合并1.2 计算统计特征1.3 groupby方法生成统计特征1.4 聚类方法1.5 log平滑2.1 相关系数法2.2 Wrapper2.3 Embedded2.4 基于树模型的特征选择法
2020-01-12 21:50:42 169
原创 test1
1、编写一段代码,要求输入一个整数N,用动态数组A来存放2~N之间所有5或7的倍数,输出该数组2、托普利茨矩阵问题如果一个矩阵的每一方向由左上到右下的对角线上具有相同元素,那么这个矩阵是托普利茨矩阵。给定一个M x N的矩阵,当且仅当它是托普利茨矩阵时返回True。3、 三数之和给定一个包含 n 个整数的数组nums,判断nums中是否存在三个元素a,b,c,使得a + b + c ...
2020-01-06 22:08:47 175
原创 LightGBM
1、LightGBMhttps://www.cnblogs.com/jiangxinyang/p/9337094.html2、LightGBM的起源https://www.jianshu.com/p/3daf08229d783、Histogram VS pre-sortedHistogram先做binning然后寻找最优划分点4、leaf-wise VS level-wiseleve...
2019-08-15 16:22:55 142
原创 XGBoost算法梳理
1、算法原理一种提升树模型,将许多树(CART树)模型集成在一起,形成一个很强的分类器2、损失函数http://www.sohu.com/a/287700387_999508073、分裂结点算法1暴力枚举:遍历所有特征的所有可能的分割点,计算Gain值,选取最大(Feature, label)去分裂2近似方法:对于每个特征,只考察分位点,减少计算复杂度4、正则化https://bl...
2019-08-12 20:42:27 250
原创 决策树模型
1、信息论基础https://blog.csdn.net/MY578719543/article/details/881236672、决策树的不同分类算法(ID3算法、C4.5、CART分类树)的原理及应用场景https://blog.csdn.net/MY578719543/article/details/881236673、回归树原理3、决策树防止过拟合手段...
2019-08-12 12:35:30 63
原创 GBDTTASK2
1、前向分布算法Adaboost算法还有另一种解释,即:可以认为Adaboost算法是“模型为加法模型、损失函数为指数函数、学习算法为前向分布算法”时的二类分类学习方法https://blog.csdn.net/yc1203968305/article/details/781714642、负梯度拟合https://blog.csdn.net/akirameiao/article/deta...
2019-08-09 20:27:46 159
原创 TASK2
1、逻辑回归与线性回归的联系与区别分类与回归:回归模型就是预测一个连续变量(如降水量,价格等)。在分类问题中,预测属于某类的概率,可以看成回归问题。这可以说是使用回归算法的分类方法输出:直接使用线性回归的输出作为概率是有问题的,因为其值有可能小于0或者大于1,这是不符合实际情况的,逻辑回归的输出正是[0,1]区间参数估计方法:https://blog.csdn.net/lx_ros/a...
2019-08-08 20:47:10 99
原创 集成学习task1
1、集成学习的概念结合多个个体学习器完成任务2、个体学习器的概念具有特定算法可构成集成学习的学习器3、boosting bagging的概念、异同点https://www.cnblogs.com/liuwu265/p/4690486.html4、理解不同的结合策略(平均法,投票法,学习法)平均法:所有学习器预测结果的平均值作为最终预测结果投票法:所有学习器预测结果的众数最为最终预测...
2019-08-07 14:09:08 101
原创 task1
1机器学习的一些概念模型Y(预测)=F(X|θ)机器学习是调整参数θ的过程Y(实际)已标定为监督学习Y(实际)自我生成为无监督学习泛化能力为模型用于新样例的能力过拟合:学习过好,学习了样本的独有的属性防止过拟合,对过拟合的回归函数进行正则化的函数j(f),使经验风险和结构风险达到平衡的函数欠拟合:学习不够好,有些属性没有学习到2线性回归原理利用数理统计中的回归分析,来确定两种或...
2019-08-06 20:32:55 146
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人