- 博客(6)
- 收藏
- 关注
原创 2018年“达观杯”复盘——任务6
2018年“达观杯”复盘——任务6一、网格搜索二、模型优化实现**数据预处理****网格搜索****LR模型****svm模型****lgb模型****结果:** 任务6: 1)进一步通过网格搜索法对3个模型进行调优(用5000条数据,调参时采用五折交叉验证的方式),并进行模型评估,展示代码的运行结果。(可以尝试使用其他模型) 2)模型融合,模型融合方式任意,并结合之前的任务给出你的最优结果。 例...
2019-04-15 21:42:29 411
原创 2018年“达观杯”复盘——任务5
2018年“达观杯”复盘——任务5一、LightGBM原理1.LightGBM简介2.xgboost缺点3.LightGBM的特点Histogram算法4.LightGBM参数详解1.核心参数2.学习控制参数3.度量函数二、python实现1.构建lgb模型2.模型参数调优参考文献: 一、LightGBM原理 1.LightGBM简介 lightGBM包含两个关键点:light即轻量级,GBM 梯...
2019-04-12 17:28:45 522
原创 2018年“达观杯”复盘——任务4
2018年“达观杯”复盘——任务4LR和SVM原理详述1.LR模型原理 注:本文主要以LR和SVM模型建模和预测,有关数据预处理,特征构造请看任务1、2 LR和SVM原理详述 1.LR模型原理 ...
2019-04-10 20:30:15 564
原创 2018年“达观杯”复盘——任务3
2018年“达观杯”复盘——任务3一、word2vec原理概述1.CBOW(Continuous Bag-of-Word Model)2.Skip-gram二、Python实现1.python的Word2vec( )参数详解2.python代码实现参考文献 一、word2vec原理概述 Word2vec 其实是语言模型训练的一个副产品,传统的统计词向量模型使用单词在特定上下文中出现的概率表征这个...
2019-04-09 20:40:00 381
原创 2018年“达观杯”复盘——任务2
2018年“达观杯”复盘——任务2一、TF-IDF原理和主要思想1.TF-IDF主要思想和应用2.TF-IDF数学定义二、python实现参考文献: 注:本文为任务1的后续,主要介绍TF-IDF的原理和python实现,数据预处理及数据观察赛题思考查看任务1:https://blog.csdn.net/weixin_41151521/article/details/89048032 一、TF-ID...
2019-04-06 16:46:28 271
原创 2018年“达观杯”复盘——任务1
2018年“达观杯”复盘——任务1赛题背景介绍一、数据获取二、数据预处理1. 数据简述2. 数据读取3.构造训练集和验证集三、 赛题理解和问题1.赛题理解2.问题 赛题背景介绍 2018年人工智能的发展在运算智能和感知智能已经取得了很大的突破和优于人类的表现。而在以理解人类语言为入口的认知智能上,目前达观数据自然语言处理技术已经可以实现文档自动解析、关键信息提取、文本分类审核、文本智能纠错等一定基...
2019-04-05 21:44:37 576
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人