自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

转载 数据竞赛必知10+采样相关策略

采样策略汇总背景数据采样很多人都听过,书上亦或是博客上面,但并不是每个人在实践中都会用到,按实践经验来讲,原始数据包含了所有的信息,我们随意增加数据亦或者是删除数据,完全是没有必要的操作...

2020-12-27 21:08:44 250

转载 入职谷歌、微软的大佬总结的刷题笔记.pdf

每个程序员都有入职谷歌、微软的梦想,但入职的不可绕过的一个门槛就是刷题。最近在逛博客的时候遇到这么一个不错的资料分享给大家本笔记中把算法分成了常考的几大类并且难度由易到难。思维导图如下并...

2020-12-24 11:20:00 154 1

转载 我用特征工程+LR超过了xDeepFM!

作者:Data Magic之前对于特征工程的了解知之甚少,后来和杰少,峰少等朋友聊完之后,也自己跑了一些竞赛,深受启发,之前一直认为特征工程是艺术,但现在我个人更倾向于认为它是一门技术,...

2020-12-23 21:08:28 356

转载 天池项目总结,特征工程了解一下!

来源:阿里云天池,案例:机器学习实践业界广泛流传着这样一句话:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”,由此可见特征工程在机器学习中的重要性,今天我们将通过《...

2020-12-22 21:10:28 532

转载 一份完整的数据科学竞赛指南!

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍“听过很多道理,却依然过不好一生;看过很多分享,却依然做不好比赛。”如今,数据科学竞赛(大数据竞赛,机器学习竞赛,人工智能算法竞赛)已经成为各大知名互联网...

2020-12-20 19:20:26 646

转载 数据项目总结:王者荣耀总决赛预测!

Datawhale干货作者:牧小熊,华中农业大学,Datawhale原创作者王者荣耀就要打KPL总决赛了,Datawhale数据项目群有粉丝希望来一期游戏数据挖掘。0. 前言玩过王者...

2020-12-17 21:21:23 688

转载 用户行为序列的特征设计和挖掘思路分享

风控用户行为序列的特征设计和挖掘本回答将分为三个部分:业务理解:风控包含哪几个阶段以及各阶段任务手动构建特征方法自动特征工程方法业务理解金融风控,可以是对于信贷类金融风控(银行贷款,花呗...

2020-12-15 08:15:00 2304

原创 怎么用matplotlib画出漂亮的分析图表

今日锦囊特征锦囊:怎么用matplotlib画出漂亮的分析图表???? Index数据集引入折线图饼图散点图面积图直方图条形图关于用matplotlib画图,先前的锦囊里有提及到,不过那...

2020-12-12 21:34:14 3847 10

转载 吴恩达老师,被曝靠「教书」实现首个IPO上市,Coursera估值50亿美元

贾浩楠 发自 凹非寺转自:量子位「连续创业者」吴恩达老师,被曝旗下企业将首次上市!这家外界估值50亿美金的公司,不是自动驾驶,不是行业垂直方案。而是吴恩达2012年创建的在线教育平台...

2020-12-11 20:31:16 170

转载 21张让你代码能力突飞猛进的速查表(神经网络、线性代数、可视化等)

随着深度学习的蓬勃发展,越来越多的小伙伴们开始使用python作为主打代码,python有着种类繁多的第三方库,这里为大家从网络上收集了一些代码速查表,包括深度神经网络、机器学习、数据可...

2020-12-10 11:20:00 131

转载 [011] Pandas的隐藏“彩蛋”组件sidetable,极大提升工作效率

“哈哈,完成了这个专栏的10篇文章推荐,稍微给自己放了2周的假,今天恢复更新!这次给大家推荐一个Pandas的组件sidetable,可以极大地提升我们的数据分析效率,主要是有4个方面...

2020-12-09 08:00:00 342

转载 推荐 | 零基础小白学PyTorch.pdf

【机器学习炼丹术】的《小白学PyTorch》系列文章被很多人好评。<<小白学PyTorch>>扩展之Tensorflow2.0 | 21Keras的API详解(...

2020-12-08 11:20:00 447

转载 MongoDB + Spark: 完整的大数据解决方案

MongoDB是一个基于分布式文件存储的数据库,最近两年声音变小了,但是在很多系统中仍然被广泛使用。如果你的系统中用到了,不妨看看这篇文章。Spark介绍按照官方的定义,Spark 是一...

2020-12-07 20:55:57 617

转载 真香!Python十大文件骚操作!!

来源:Python数据科学作者:东哥起飞日常对于批量处理文件的需求非常多,用Python写脚本可以非常方便地实现,但在这过程中难免会和文件打交道,第一次做会有很多文件的操作无从下手,只能...

2020-12-06 09:24:51 119

转载 Kaggle神器LightGBM最全解读!

本文主要内容概览:1. LightGBM简介GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树...

2020-12-04 20:47:56 398

原创 关于日期特征,你想知道操作都在这儿~

今日锦囊特征锦囊:关于日期特征,你想知道操作都在这儿~???? Index字符串转日期日期转字符串13位的时间戳转 日期格式str13位的时间戳转datetime10位的时间戳转 日期格...

2020-12-03 11:20:00 497

转载 一个从数据小白到大佬的小姐姐

今天给大家推荐我的朋友可乐,她是公众号【可乐的数据分析之路】的号主。在用Excel、SQL、Python进行数据分析领域内的文章被阅读分享很多次,正如公众号的名字:可乐的数据分析之路,她...

2020-12-02 11:20:00 114

转载 太cool了!这些Python高阶函数。

作者:皮钱超,厦门大学,Datawhale原创作者本文约2000字,建议阅读6分钟审稿人:耿远昊,Datawhale成员,华东师范大学,开源教程《Joyful-Pandas》核心贡献者。...

2020-12-01 11:10:00 140

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除