自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。

  • 博客(5)
  • 资源 (5)
  • 收藏
  • 关注

原创 谈谈你对集成学习的见解与认识,描述一下它们的优势所在?

【每日一问】谈谈你对集成学习的见解与认识,描述一下它们的优势所在?Datawhale优秀回答者:HipHopMan集成方法有很多种,一种叫做bagging,bagging的思想是,我把我的数据做一点微小的调整,就得到了一个跟原来不一样的数据集,我就能多训练一个模型出来,模型的数量多了,解释力自然就增强了。比如说我原来有100个人的数据,其中有两个分别叫Tony和Lily,我把Tony这条数据删...

2019-03-22 00:35:06 3948

原创 Datawhale第五期组队学习团队成员

第三期集训团队成员集训准负责人奖惩助教算法梳理苏静康兵兵算法梳理进阶黑桃胡稳算法实践刘广月杨煜算法实践进阶排骨龙俊豪编程吕雪杰孙超统计学王佳鑫许辉Leetcode于鸿飞杨皓博Python叶梁张云鹏准负责人准负责人建立各自的集训群和集训报名群准负责人对接李碧涵确定集训内容和准负责人职责(除新...

2019-03-18 23:31:10 1187

原创 面试官比较看重简历中的哪些维度,有什么写简历的技巧、建议和总结?

【每日一问】面试官比较看重简历中的哪些维度,有什么写简历的技巧、建议和总结?Datawhale优秀回答者:千夜同学,陶志杰第一 ,简历一定要工整 字体格式对奇 字体大小不一 格式错乱 文字乱码的 都懒得看 直接垃圾桶(千万别模版导出)第二 ,一定要有"卖点" 就是所谓的项目经验 但是"课程表、图书管理系统"这种作业级别的项目少写,只会突出你没能力第三 ,阅读的过程是从上而下的,蓝桥杯 xx...

2019-03-14 22:41:45 1805

原创 当我们拿到数据进行建模时,如何选择更合适的算法?

【每日一问】当我们拿到数据进行建模时,如何选择更合适的算法?Datawhale优秀回答者:mashagua,金小楗目标导向机器学习1.先看是分类问题还是回归问题(分类就先从常用的分类模型里选择)2.其次,看数据特征的数据类型,然后做一些初步的数据统计,比如是否数据均衡,大致的数据分布是怎样的(不同类别的分布)3.然后判断用哪个比较合适一些,是树模型还是其他的分类模型。4.最后查看...

2019-03-07 18:12:39 7765

原创 如何阅读英文文献,有哪些高效的方法或者辅助工具?

【每日一问】如何阅读英文文献,有哪些高效的方法或者辅助工具?Datawhale优秀回答者:追风者方法先是通读文献综述(理解专业术语和基本概念),起初时应以泛读为主;再研读自己研究领域的经典论文50篇+;确定研究方向之后,要以精读为主,要做到边读文献边做笔记,尤其是在文献中遇到的疑惑点(可以查看参考文献)做出Hightlight标记,因为这些疑惑点将是我们后期主要关注的对象;每周抽出1-2...

2019-03-01 16:38:12 10669

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材 而掌握算法和数据结构是拿到好offer必备的核心技能!

2018-08-22

机器学习_数学基础_精选教材(概率,线代,微积分)

普林斯顿微积分读本高清中文版 概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作,和国内同济版相比,通俗易懂,易于自学。 奠定机器学习数学基础,三本教材就够了!!!

2018-08-09

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集 主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除