自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。

  • 博客(36)
  • 资源 (5)
  • 收藏
  • 关注

原创 【精简教程版】100行代码入手天池CV赛事

Datawhale作者:阿水、陈信达 Datawhale成员本文针对阿里天池《零基础入门CV赛事-街景字符编码识别》,给出了百行代码Baseline,帮助cv学习者更好地结合赛事...

2020-05-31 18:35:48 715

转载 NLP工程师平均月薪3W起,如何从文本情感分析入坑NLP?

噔噔噔,关注开课吧的一名粉丝转行做算法工程师了,滴滴,年薪40W。他本科是学物理的,研究生考进了华科大的统计学,毕业后做了一年的java开发,今年初开始学4个多月AI,然后顺利拿到滴滴 ...

2020-05-30 10:00:00 1639

转载 这是一份非常全面的开源数据集!

Datawhale推荐来源:机器之心编译近期,skymind.ai 发布了一份非常全面的开源数据集。内容包括生物识别、自然图像以及深度学习图像等数据集,现机器之心将其整理如下:(内附...

2020-05-30 10:00:00 6292 1

转载 深入浅出Yolo系列之Yolov3&Yolov4核心基础知识完整讲解

Datawhale干货作者:知乎-江大白 编辑:AI算法与图像处理本文来源:https://zhuanlan.zhihu.com/p/143747206已授权转载,如需转载请联系原...

2020-05-30 10:00:00 3190

转载 基于图神经网络的聚类研究与应用

Datawhale干货本文编辑:Datawhale用手机上网的时候,总有种感觉,推荐的视频是我爱看的,推荐的美食是我爱吃的,大家长的又好看,说话又好听。有时候会对自己发出灵魂拷问:难...

2020-05-29 09:14:34 5405

原创 数据分析索引总结(上)Pandas单级索引

Datawhale干货作者:闫钟峰,Datawhale优秀学习者寄语:本文对单级索引中的loc、iloc、[]三种方法进行了详细的阐述。同时,对布尔索引,快速标量索引方式、区间索引方...

2020-05-28 20:00:00 5020 2

原创 数据分析索引总结(下)Pandas索引技巧

Datawhale干货作者:闫钟峰,Datawhale优秀学习者寄语:本文对索引设定、常用索引型函数、重复元素处理、抽样函数等内容做了详细介绍。索引设定1. index_col参数i...

2020-05-28 20:00:00 1212

原创 数据分析索引总结(中)Pandas多级索引

Datawhale干货作者:闫钟峰,Datawhale优秀学习者寄语:本文介绍了创建多级索引、多层索引切片、多层索引中的slice对象、索引层的交换等内容。创建多级索引1. 通过fr...

2020-05-28 20:00:00 2191

原创 KDD'20 Workshop 来了!学术竞赛,发表Paper,针对疫情设计隔离策略

Datawhale主办方:KDD、宾夕法尼亚州立大学、上海交通大学等顶级会议KDD,国内外高校联合发起新型冠状病毒(COVID-19)感染的肺炎疫情牵动着全世界的心。大数据、人工智能...

2020-05-27 09:00:00 560

转载 如何阅读一份深度学习项目代码?

犹豫很久要不要把读代码这个事情专门挑出来写成一篇推文。毕竟读代码嘛,大家可能都会读。而且笔者个人读的和写的代码量也并不足以到指导大家读代码的程度。但笔者还是决定大胆地写一点:就当是给自己...

2020-05-26 20:00:00 1692 1

原创 图像数据读取及数据扩增方法

Datawhale干货作者:王程伟,Datawhale成员本文为干货知识+竞赛实践系列分享,旨在理论与实践结合,从学习到项目实践。(零基础入门系列:数据挖掘/cv/nlp/金融风控/...

2020-05-25 19:30:00 1983

原创 常用数据增广方法,解决数据单一问题

Datawhale干货作者:陈信达,Datawhale优秀学习者寄语:本文将对传统图像算法的数据增广方式进行学习,以最常用的平移和旋转为例,帮助大家梳理几何变换的概念和应用,并对其在...

2020-05-24 09:26:59 3691

转载 13个Offer,8家SSP,谈谈我的秋招经验

前言大家好,我是卖萌屋的小Q,是夕小瑶学姐的同实验室师弟(2020届)。在学姐的建(bian)议(ce)下写了本文,希望能够给21届的师弟师妹提供一些启发,秋招之路能够更加顺利~往昔的回...

2020-05-23 19:30:00 745

转载 2020 腾讯广告算法大赛:突破高分瓶颈方案分享

写在前面期待已久的2020腾讯广告算法大赛终于开始了,本届赛题“广告受众基础属性预估”。本文将给出解题思路,以及最完备的竞赛资料,助力各位取得优异成绩!!!报名链接:https://al...

2020-05-23 19:30:00 2033

转载 如何利用微信高效地做好「时间管理」?

如何利用微信做好「时间管理」?前两天发的学习文章可能有点太干了,担心大家噎着,所以今天就不发太硬核的学习内容,聊一聊怎么用微信做好「时间管理」。微信作为一款即时通讯工具,已经成了每个人手...

2020-05-22 08:51:44 856

转载 178页,四年图神经网络研究精华汇总

Datawhale推荐来源:机器之心对于普通人来说,将自己的学位论文公布到社交媒体可能需要点勇气。但如果实力够硬,多少人检阅都是不怕的。最近,图卷积网络(GCN)的作者 Thomas K...

2020-05-22 08:51:44 184

原创 零基础入门CV赛事,理论结合实践

Datawhale干货作者:阿水,Datawhale成员本次分享的背景是,Datawhle联合天池发布的学习赛:零基础入门CV赛事之街景字符识别。本文以该比赛为例,对计算机视觉赛事中...

2020-05-21 18:31:36 520

转载 图灵奖得主Hamming对于少数人获得重大成果原因的思考,送给此刻克服迷惘坚持前行的你...

Datawhale干货来源:浅梦的学习笔记“为什么有的科学家做出了影响深远的重大成果,而大多数其他人的成果都被历史遗忘了?”文章来源:AlphaSue https://zhuanl...

2020-05-18 10:01:00 760

转载 Jupyter官方神器:可视化 Debug 工具!

以后 Jupyter 也能做可视化 Debug,Jupyter 团队发布第一个 Debug 插件与内核。Python 代码编辑器怎么选?PyCharm、VS Code、Jupyter N...

2020-05-17 19:31:00 2432

转载 Kaggle知识点:数据分析思路与工具(EDA)

Kaggle知识点数据分析在现有数据竞赛和数据领域中数据分析是重要组成部分,且数据分析与具体的业务背景和业务逻辑联系紧密。数据分析是发现数据规律的有效方法,也是验证思路的有效方法。本文将...

2020-05-17 19:31:00 1131

转载 百度内部PPT流出:数据分析的道与术

Datawhale干货来源:数据在线,百度内部PPT这是一份来自百度内部的数据分析学习PPT,非常经典的入门教材。主要内容1、什么是数据分析(道)1.1 数据分析是什么?1.2 什么...

2020-05-16 19:31:00 765

转载 2020腾讯广告算法大赛:赛题理解与解题思路

写在前面期待已久的2020腾讯广告算法大赛终于开始了,本届赛题“广告受众基础属性预估”。本文将给出解题思路,以及最完备的竞赛资料,助力各位取得优异成绩!!!报名链接:https://al...

2020-05-15 19:31:00 6466 2

转载 周志华机器学习学习路线最全汇总!不止于西瓜书

编辑 | Will出品 | 字节AI南京大学教授,博士生导师,教育部“长江学者”特聘教授,国家杰出青年基金获得者!周志华老师的头衔太多了!相信每一个从事或爱好机器学习的朋友都知道周志华老...

2020-05-15 19:31:00 1951 1

原创 五月组队学习!

Datawhale学习联合主办:阿里云天池、图森未来、华章图书寄语:本次计算机视觉 (cv) 组队学习,属于零基础实践系列,旨在理论结合实践,帮助学习者对计算机视觉项目的完整流程进行...

2020-05-14 19:31:00 656

原创 计算机视觉组队学习预告!提前进群

Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更...

2020-05-13 20:00:00 332

转载 学习!机器学习算法优缺点综述

Datawhale干货来源:数据派THU、七月在线目录正则化算法(Regularization Algorithms)集成算法(Ensemble Algorithms)决策树算法(D...

2020-05-12 19:43:55 574

转载 数据缺失、混乱、重复怎么办?最全数据清洗指南!

Datawhale推荐机器之心编译要获得优秀的模型,首先需要清洗数据。这是一篇如何在 Python 中执行数据清洗的分步指南。在拟合机器学习或统计模型之前,我们通常需要清洗数据。用杂...

2020-05-11 19:31:59 1792 1

原创 透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等

Datawhale作者:邱锡鹏,复旦大学教授寄语:本文对PAC学习理论、没有免费的午餐定理、丑小鸭定理、奥卡姆剃刀原理等机器学习中有名的理论或定理进行了详细的梳理。在机器学习中,有一...

2020-05-10 19:58:49 1350 4

原创 Datawhale团队第一期录取名单!

Datawhale作者:Datawhale成员Datawhale已经成立一年半了。Datawhale从一开始的12个人,学习互助,到提议建立开源组织,做更多开源的事情,帮助更多的学...

2020-05-09 20:18:36 1731

原创 机器学习建模神器PyCaret已开源!提升效率,几行代码轻松搞定模型

Datawhale干货编译:张峰,Datawhale成员寄语:PyCaret,是一款 Python中的开源低代码(low-code)机器学习库,支持在「低代码」环境中训练和部署有监督...

2020-05-08 19:31:00 7997 5

原创 一文详尽之支持向量机算法!

Datawhale干货作者:小一,Datawhale优秀学习者寄语:本文介绍了SVM的理论,细致说明了“间隔”和“超平面”两个概念;随后,阐述了如何最大化间隔并区分了软硬间隔SVM;...

2020-05-07 19:31:00 1674 2

原创 复旦大学邱锡鹏教授:一张图带你梳理深度学习知识脉络

Datawhale作者:邱锡鹏,复旦大学教授寄语:本文梳理了深度学习知识体系,分为机器学习、神经网络和概率图模型,同时对机器学习算法类型、深度学习原理框架等进行了梳理,帮助大家更好地...

2020-05-07 09:41:15 1529

转载 查阅arXiv论文新神器,一行代码比较版本差别,Github新开源!

贾浩楠 发自 凹非寺量子位 报道 | 公众号 QbitAI在arXiv上发现了一篇中意的论文,当然是下载保存慢慢研究!然而,等你好不容易看完了文章,发现作者又上传了V2、V3,一眼望去却...

2020-05-04 19:15:00 491

原创 NLP经典算法复现!CRF原理及实现代码

Datawhale作者:丁媛媛,Datawhale优秀学习者寄语:本文先对马尔可夫过程及隐马尔可夫算法进行了简单的介绍;然后,对条件随机场的定义及其三种形式进行了详细推导;最后,介绍...

2020-05-03 19:10:00 3333

原创 想做数据分析?这个比赛适合你!

Datawhale赛事平台:和鲸科技-Kesci寄语:本次大赛是面向数据分析的专门赛事,设置了22万的奖金,及30万+的基金支持。同时提供了多场数据分析专题分享,帮助参赛者快速学习提...

2020-05-02 19:01:00 2142

原创 深入浅出聚类算法!如何对王者英雄聚类分析,探索英雄之间的秘密

Datawhale作者:小一,Datawhale优秀学习者寄语:首先,对聚类算法进行了介绍;然后,解释了EM算法E步、M步的原理;最后,对sklearn参数进行了详解,并对王者荣耀英...

2020-05-01 19:01:25 1172

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材 而掌握算法和数据结构是拿到好offer必备的核心技能!

2018-08-22

机器学习_数学基础_精选教材(概率,线代,微积分)

普林斯顿微积分读本高清中文版 概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作,和国内同济版相比,通俗易懂,易于自学。 奠定机器学习数学基础,三本教材就够了!!!

2018-08-09

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集 主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除