自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据分析-项目实战:Kaggle泰坦尼克号(Titanic)沉船幸存者预测(易懂快速上手版)-二元分类-自读

#前言Kaggle上的泰坦尼克项目,对于初学机器学习的朋友来说,是一个很好的练手机会,能大概了解整个机器学习的全过程。下面我把自己做这个项目的经验分享一下,希望对想了解机器学习的朋友有所帮助,里面结合很多前辈的智慧,大家可以参考最后的链接。在文章最开头,我分享一下实际应用项目和竞赛项目的区别,实际应用中,训练的样本相对于实际的数据集总是少的,而它的评分标准,是以实际的数据集的准确度作为参考的,...

2019-08-03 11:59:04 3421

原创 蚂蚁金服终极野心——万“税”帝国

去年从德国回来,被朋友问的最多的问题就是,“你为什么从德国回来啊,待在德国多好啊。”我一般会说,“我在德国5年,唯一的变化就是,能在德国超市用支付宝了。”确实,德国变化太慢,是一个适合养老的地方,而我不想年纪轻轻就看到自己老去的样子。但这从另一个侧面可以看出,支付宝不但在国内给大家的生活带来了方便,而且正在加速进行全球化,将我们中国的发明普惠到全世界。作为中国人,在德国超市用支付宝,德国老大爷老...

2018-12-24 14:29:00 2479 2

原创 数据分析-效率工具:函数和类(Python)-你数据分析帝国的钢筋和水泥

刚开始学习数据分析的时候,觉得函数好难啊,因为没有编程基础,所以一直不知道什么叫类。直到后来自己开始在kaggle做竞赛项目,发现每次都做着重复的动作,调节参数,挖掘数据,发现这哪是数据分析该做的事情啊,明明就是个体力活嘛,还好自己看的数据分析的书里,还有看别人的kernel里,有看到类,觉得好高端啊,这个东西一定很有用吧,自己之前为了方便,会自己建一些函数,但是还是不能满足自己的需求,为了避免浪...

2018-12-01 18:48:54 225

原创 Kaggle泰坦尼克号(易懂快速上手版)沉船幸存者预测-二元分类

#前言Kaggle上的泰坦尼克项目,对于初学机器学习的朋友来说,是一个很好的练手机会,能大概了解整个机器学习的全过程。下面我把自己做这个项目的经验分享一下,希望对想了解机器学习的朋友有所帮助,里面结合很多前辈的智慧,大家可以参考最后的链接。在文章最开头,我说一下实际应用项目和竞赛项目的区别,实际应用中,训练的样本相对于实际的数据集总是少的,而它的评分标准,是以实际的数据集的准确度作为参考的,而...

2018-12-01 15:21:18 4745 3

原创 数据分析-数据转换:Python-pandas模块,分组函数groupby中(apply,agg,transform)方法的比较

pandas模块给数据处理的能力给予了很大的助力,但是初学者刚开始可能会被其中分组聚合的三个方法(apply,agg和transform),弄的头晕眼花,至少我自己学习的过程中是这样的,看了网上的很多解释,觉得对于初学者理解起来还是蛮困难的,翻阅了好几本python数据分析的书籍,自己总算理解了个大概,在这里给大家讲一下这三个方法。 具体请看《Python数据科学手册》(Jake Vander...

2018-11-05 18:41:23 6508 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除