![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 70
Apoca——20200202
这个人很懒,没有写简介~
展开
-
Python在WIN10上安装glove_python
Python安装glove——pythpip install glove_python原创 2021-05-28 09:50:15 · 407 阅读 · 0 评论 -
【卡方分箱】理论 & Python源码解析
一、介绍分箱就是将特征进行离散化处理的过程,将变量可能取值的范围依据一定的挡板进行分隔。比如年龄这个变量是,可以分箱为0-18,18-30,30-45,45-60,婚姻状况这个变量,可以分为【初婚、复婚】,【未婚、未知】,【离异、丧偶】等。 分箱的好处主要有这些:分箱后的特征对异常数据有更强的鲁棒性。比如年龄中有一个异常值为300,分箱之后就可能划到>80这一箱中,而如果直接入模的话会对模型造成很大干扰。 特征离散化之后,每个变量有单独的权重,可以为逻辑回归模型引入了非线性,能够提升模型原创 2021-04-14 16:48:34 · 1969 阅读 · 0 评论 -
【机器学习】基于Xlearn的sklearn接口的ffm模型搭建
一、介绍最近在进行风控相关的模型搭建,一般使用xgb和lr等的模型,突然想尝试一下ffm模型看看效果,之前在做推荐任务时有通过torch实现,但是在一些项目上部署比较麻烦,自己写的代码在优化上也不是很好,因此这次准备通过第三方库的形式进行ffm模型构建。在网上搜罗了一下,实现相关算法的python库有:LibFFM、xlearn和tffm等。今天给大家讲讲基于xlearn的研究和其中需要准备的一些工具。xLearn是一款高性能,易于使用且可扩展的机器学习软件包,包括FM和FFM模型,可用于大规模解决原创 2021-03-26 10:31:12 · 1108 阅读 · 1 评论 -
【机器学习】之模型融合技术
本文部分内容摘取自:https://blog.csdn.net/sinat_35821976/article/details/83622594https://blog.csdn.net/u014248127/article/details/78993753模型优化之模型融合简介在产业化的机器学习建模任务中,耗时最长的是数据处理和模型优化两个方面,今天讲讲模型优化的方法。对于初学者而言,模型优化一般仅仅体现在调参的工作之中,即通过对模型内置的参数或者正则项进行调优使模型表现达到最佳。.原创 2021-01-07 14:33:10 · 1927 阅读 · 0 评论