数据分析
Wing·三金
这个作者很懒,什么都没留下…
展开
-
数据分析(一)基本模型与概念
数据分析(一)基本模型与概念基本模型数据分析模型文本分析模型主要概念数据分析数据挖掘推荐系统社交网络文本分析基本模型在本系列中所谈及的数据分析主要是指最基础、最常见的技术操作,以及与文本挖掘、自然语言处理的交叉部分。疏漏之处请各位大佬指出。这第一篇是作为字典用的,总结本系列中出现的基础模型和主要概念。暂时就想到这些,后边有发现其他发现再不定期更新吧。数据分析模型业务调研准备数据...原创 2019-01-14 10:10:39 · 3249 阅读 · 1 评论 -
数据分析(二)数据预处理
数据分析(二)数据预处理缺失值处理删除法填补法异常值检测错误发现与修复变量离散化变量标准化实体识别数据抽样和过滤欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的...原创 2019-01-16 11:18:47 · 3189 阅读 · 0 评论 -
数据分析(三)实战——分类模型(随机森林与 AdaBoost )
数据分析(三)实战——分类模型(随机森林与 AdaBoost )基本信息数据预处理观察数据集特点数据集划分特征选择异常值检测离散化标准化模型训练分类器选择评估指标选择训练过程默认参数训练结果参数调整最优训练结果结语前言:根据个人的学习经历,最无奈的就是前面学习了一大堆的零碎知识点,却压根不知道怎么去使用,更不清楚前面所学的哪个知识点可以在哪里派上用场。所以这第三篇文章笔者打算先拿一个简单的案例...原创 2019-01-21 22:38:44 · 8621 阅读 · 1 评论 -
数据分析(四)简单模型 VS 集成模型(概述)
数据分析(四)简单模型 VS 集成模型(概述)简单模型分类模型概述常见模型回归模型概述常见模型聚类模型集成模型Bagging概述常见模型Boosting概述常见模型Stacking在数据分析所使用的模型中,不管是分类、回归还是聚类,都可划分为【简单模型】和【集成模型】。后者是以前者为基础的特定组合方式,我们在天池、Kaggle、Github 上看到的那些非常牛逼的模型基本上都是集成的。如果想...原创 2019-03-04 09:09:23 · 2853 阅读 · 0 评论 -
2019招行FinTech精英训练营线上竞赛总结
2019招行FinTech精英训练营线上竞赛总结FinTech是什么线上竞赛思路选题尝试一尝试二尝试三比赛结果反思暂时总结线上竞赛部分,等面试完后再看情况是否更新这篇文章。因为涉及隐私数据,所以我只能边提思路边提供自己的部分代码,数据方面就无能为力啦。 FinTech是什么简单地说,它是招行为了选拔训练营的人才而设立的 竞赛 。这是我第一次参加实战,本来也没奢望能拿到面试资格,没想到...原创 2019-05-16 17:37:33 · 7761 阅读 · 13 评论 -
数据分析(五)Boosting 集成模型:AdaBoost 与 GBDT(上)
数据分析(五)Boosting 集成模型:AdaBoost 与 GBDTAdaBoostGBDT这一讲是关于两个最常见的集成模型的具体实现原理—— AdaBoost 和 GBDT。理解原理的用处,是为了能明白模型的局限性和适用场景,在出问题时能尽快地定位到核心问题所在。That’s pretty much it. Let’s get started!AdaBoostGBDT...原创 2019-06-04 10:42:46 · 498 阅读 · 0 评论