- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 零基础入门推荐系统 - 新闻推荐(一)
零基础入门推荐系统 - 新闻推荐(一)赛题地址背景:随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:作为信息消费者,如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情;作为信息生产者,如何让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另
2020-11-25 19:55:33 2508
原创 二手车价格预测实战(四)——模型融合
模型融合定义:模型融合:把独立的学习器组合起来的结果如果独立的学习器为同质,称为基学习器(都为SVM或都为LR)如果独立的学习器为异质,称为组合学习器(将SVM+LR组合)为啥要模型类型:1.简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank ave...
2020-04-05 22:45:12 1330
原创 二手车价格预测实战(三)——建模调参
理论知识模型调参常用方法:网格搜索+交叉验证:通过循环遍历,尝试每一种参数组合,返回最好的得分值的参数组合。把数据集划分三份,一份是训练集(训练数据),一份是验证集(调整参数),一份是测试集(测试模型)贝叶斯调整超参数:贝叶斯优化是一种用模型找到函数最小值方法,已经应用于机器学习问题中的超参数搜索,这种方法性能好,同时比随机搜索省时。通过基于目标函数的过去评估结果建立替代函数(概率模...
2020-03-31 21:14:44 1781 2
原创 二手车价格预测实战(二)——特征工程
特征工程方法异常值处理方法:线性回归是基于正态分布的前提假设,所以对其进行统计分析时,需经过数据的转换,使得数据符合正态分布。box-cox转换:在做线性回归的过程中,一般线性模型假定; Y=Xβ + ε, 其中ε满足正态分布,但是利用实际数据建立回归模型时,个别变量的系数通不过。例如往往不可观测的误差 ε 可能是和预测变量相关的,不服从正态分布,于是给线性回归的最小二乘估计系数的结果带...
2020-03-27 22:04:37 1909
原创 二手车价格预测实战(一)——数据探索
数据探索:欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会带来...
2020-03-24 21:32:02 9501 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人