python
文章平均质量分 84
我曾经被山河大海跨过
这个作者很懒,什么都没留下…
展开
-
python学习笔记一(pandas入门)
前言最近在CSDN、知乎上follow了一些大神,看了他们的一些博客、个人网站有很多有价值的分享,感觉时常做学习笔记是很好的学习习惯。反观自己,一直浑浑噩噩,知识结构琐碎,于是乎,装了markdown pad2(win10装了后不能实时渲染来着, 然后再装个awesomium_v1.6.6_sdk_win重启即可),立个flag:养成做学习笔记的习惯,希望不久后可以有所进步,分享有价值的东西。原创 2016-08-15 23:49:13 · 1745 阅读 · 0 评论 -
python学习笔记二(pandas基础)
大写的吐槽:暑假提前结束,实验室项目越来越紧,略烦躁(不喜欢做的项目),没啥自由学习的时间了。只有抽些零散的时间去准备数据挖掘比赛相关的东西。最近关注的大神 wepon,bryan的博客,干货多多! PS: 实验室师兄们找工作也是压力山大,祝他们好运!今天继续pandas基础学习,参考资料还是来自以下网址,练习数据换成自己的,加深印象: http://www.open-open.com/lib原创 2016-08-16 23:33:20 · 21382 阅读 · 4 评论 -
随机森林(Random Forest)入门与实战
随机森林(Random Forest)入门与实战前言集成学习(ensemble learning)是通过构建并结合多个学习器来完成学习任务,主要包含两类,一是个体学习器间存在强依赖关系、必须串行生成的序列化方法,比如前几篇博文介绍[提升学习方法]、 (http://blog.csdn.net/sb19931201/article/details/52425487)、提升树GBDT 详解、xgboost等。原创 2016-09-20 22:11:23 · 15175 阅读 · 1 评论 -
Coding_Algorithms(剑指Offer系列)
写在前面:2016.12.07开始刷题模式,掌握基础算法的同时学习巩固C++和Python编程基础,每道算法题我会尽量用两种语言去实现。目前是从剑指offer(牛客网)开始,欢迎同道中人共同学习,批评指正。本地测试代码和笔记会更新在我的github上Coding_Algorithms。ppi and ipp (自己琢磨的问题,还没搞明白,置顶)i++和++i的问题: i++和++i的问题,解释下原创 2016-12-07 22:14:17 · 1893 阅读 · 0 评论 -
用户贷款风险预测之Top10初体验
用户贷款风险预测之Top10初体验写在前面:DataCastle智慧中国杯全国大数据创新应用大赛:本次参加的是三大赛题中的用户贷款风险预测(算法竞赛) 距离上次发博文又过去近两个月了,坚持写博客是件不容易的事,还得继续努力!中间过了个年,打了个比赛,时间过得真快,不过没有闲着,用寒假时间终于拿到比较满意的成绩。参加这个比赛是快放寒假的时候,想寒假找点事做做,当时就DC有三个比赛了吧,交通赛数据太大原创 2017-02-21 22:01:11 · 16428 阅读 · 20 评论 -
xgboost入门与实战(实战调参篇)
xgboost入门与实战(实战调参篇)前言前面几篇博文都在学习原理知识,是时候上数据上模型跑一跑了。本文用的数据来自kaggle,相信搞机器学习的同学们都知道它,kaggle上有几个老题目一直开放,适合给新手练级,上面还有很多老司机的方案共享以及讨论,非常方便新手入门。这次用的数据是Classify handwritten digits using the famous MNIST data—手写数原创 2016-09-18 20:33:37 · 68817 阅读 · 17 评论 -
XGBoost Plotting API以及GBDT组合特征实践
XGBoost Plotting API以及GBDT组合特征实践写在前面:最近在深入学习一些树模型相关知识点,打算整理一下。刚好昨晚看到余音大神在Github上分享了一波 MachineLearningTrick,赶紧上车学习一波!大神这波节奏分享了xgboost相关的干货,还有一些内容未分享….总之值得关注!我主要看了:Xgboost的叶子节点位置生成新特征封装的函数。之前就看过相关博文原创 2017-03-23 18:51:07 · 19807 阅读 · 13 评论