![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
slow-wing
信徒只需要相信,行者不断思考。
展开
-
Datawhale模型融合
模型融合类型方式: 1、简单加权融合: 回归(分类概率):算术平均融合,几何平均融合 分类:投票 综合:排序融合,log融合 2、stacking/blending 构建多层模型,并利用预测结果再拟合 3、boosti...原创 2020-04-04 20:24:10 · 296 阅读 · 0 评论 -
Datawale3建模与调参数
训练模型以及预测的一般流程:在模型的预测上面需要注意:模型选择: 1、依据在验证集上的效果选择 2、除了关注效果的均值,还要关注稳健性 3、还需考虑线上效果;可将线上效果视为一折数据参数选择: 1、不建议将精力放在参数调优上; 2、容易过拟合 大体的设置参数即可 应将精力重点放在特征工程; ...原创 2020-04-01 19:33:25 · 368 阅读 · 0 评论 -
DataWhale活动
本文只是大概记录一下数据挖掘的探索过程:train = pd.read_csv('./used_car_train_20200313/used_car_train_20200313.csv',delimiter=' ')test = pd.read_csv('./used_car_testA_20200313/used_car_testA_20200313.csv',delimiter=' ...原创 2020-03-24 21:57:19 · 146 阅读 · 0 评论 -
Apriori算法原理
算法常见:运用于推荐商品。关联规则:简单举例->市场购物篮分析的结果是一组指定商品之间关系模式的关联规则。• 一个典型的规则可以表述为: {花生酱,果冻} –> {面包}• 这个关联规则用通俗易懂的语言来表达就是:如果购买了花生酱和果冻,那么也很有可能会购买面包。支持度和置信度一个项集或者规则度量法的支持度是指其在数据原创 2017-04-24 21:33:41 · 1325 阅读 · 0 评论 -
机器学习--线性回归
线性回归属于回归问题,将线性回归大体分为以下几个类别:一元线性回归: y=wx+b 多元线性回归 y=w(0)+w(1)x(1)+w(2)x(2)带正则项的线性回归 带核函数的线性回归: 回归模型: 学习模型(训练):已知数据(x,y)学习模型f使用模型(预测):已知数据的输入x,带入f求得y模型介绍:如果...原创 2018-05-02 17:51:26 · 373 阅读 · 0 评论 -
Python matplot数据可视化
简介: 在数据挖掘项目初期,需要对数据进行探索性分析,这样方便对数据有一个大致的了解,其中最直观的方式就是对数据进行可视化。 可视化视图有哪些? 可视化图可以分为4个类别,分别是比较,联系,构成和分布。 1、比较:比较数据间的类别关系,或者是它们随着时间的变化趋势,比如折线图。 2、联系:查看两个变量及两个以上变量的关系,比如散点图。 3、构成:每个部...原创 2019-01-21 22:39:55 · 865 阅读 · 0 评论