自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。

  • 博客(35)
  • 资源 (5)
  • 收藏
  • 关注

转载 如何加入到 wuhan2020 开源项目,打赢这场没有硝烟的战争?

比尔盖茨2015年在 Ebola 爆发之后做的 TED 演讲前言这是比尔盖茨2015年在 Ebola 爆发之后做的 TED 演讲。他认为在未来几十年里,如果有什么东西可以杀掉上千万人,那...

2020-01-31 20:15:17 2804

转载 详解医学顶刊《柳叶刀》最新发表新型冠状病毒研究论文

前言新型冠状病毒(2019-nCoV)的突发恰逢春节,千家万户都对疫情十分关注。令人心痛的是,病毒带来的不止有病痛,还有来自各路媒体的大量谣言和不实解读。作为科研工作者的我们,希望能略尽...

2020-01-30 21:34:22 5503

转载 从六大概念总结吴恩达机器学习书籍:如何做好工程项目实践?

选自towardsdatascience作者:Niklas Donges机器之心编译在 ML 工程实践中,很多时候都会走一些弯路,可能是模型选错了,也可能是某个超参数一直不正确。那么我们...

2020-01-30 21:34:22 506

转载 特征工程学习,19项实践Tips!代码已开源!

随着我们在机器学习、数据建模、数据挖掘分析这条发展路上越走越远,其实越会感觉到特征工程的重要性,平时我们在很多地方都会看到一些很好的特征工程技巧,但是都会是一个完整项目去阅读,虽然说这样...

2020-01-29 20:36:39 454

转载 深入理解GBDT多分类算法

目录:GBDT多分类算法1.1 Softmax回归的对数损失函数1.2 GBDT多分类原理GBDT多分类算法实例手撕GBDT多分类算法3.1 用Python3实现GBDT多分类算法3.2...

2020-01-28 20:42:59 2617

转载 自学机器学习课程怕踩雷?有人帮你选出了top 5优质课

选自Medium作者:LearnDataSci机器之心编译本文作者在多年研究在线学习图景、在不同平台注册大量机器学习课程后,收集了目前最好的 5 门机器学习课程。机器学习根植于统计学,正...

2020-01-27 20:40:13 862

转载 收藏、学习一气呵成,2019年机器之心干货教程都在这里了

机器之心整理参与:张倩、蛋酱从 2016 年起,机器之心每年都会盘点全年的精华教程。去年就有小伙伴留言说要在 2019 年上半年把 2018 年的教程合集「啃下来」。现在都 2020 了...

2020-01-26 20:20:00 2018

转载 这个Python库可以偷懒,和import说再见!

还记得入门Python数据分析时经常会import几个库,下面这几个可谓是入门学习时的四大护法,Python数据处理和可视化常会用的工具。不知道大家有没有遇到过这样一个问题,每次重新开启...

2020-01-24 17:25:24 366

转载 强烈推荐!最好用的《机器学习实用指南》第二版终于来了,代码已开源!

早在去年的这个时候,红色石头就发文给大家推荐过一本非常棒的机器学习实用指南书籍《Hands-On Machine Learning with Scikit-Learn & Ten...

2020-01-23 10:01:00 1182

转载 神经网络激励函数的作用是什么?有没有形象的解释?

来自 |知乎地址 | https://www.zhihu.com/question/22334626/answer/103835591神经网络激励函数的作用是什么?有没有形象的解释?颜...

2020-01-23 10:01:00 681

原创 数据处理:离散型变量编码及效果分析

Datawhale作者:小雨姑娘,Datawhale成员 离散型变量编码的Python库首先我要介绍这个关于离散型编码的Python库,里面封装了十几种(包括文中的所有方法)对于离散...

2020-01-21 21:18:27 1507 1

转载 Reformer: 高效的Transformer

作者:Nikita Kitaev, Łukasz Kaiser编译:ronghuaiyang理解序列数据 —— 如语言、音乐或视频 —— 是一项具有挑战性的任务,特别是当它依赖于大量的周...

2020-01-21 21:18:27 434

转载 数据分析画图:50道练习玩转matplotlib

DatawhaleDatawhale,和鲸社区编辑Matplotlib 是 Python 的绘图库。它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案,也可以和图...

2020-01-20 21:01:00 2755

原创 灵魂拷问:你看过Xgboost原文吗?

Datawhale作者:小雨姑娘,Datawhale成员事情的源头是这样的,某日我分享了一篇阿里机器学习工程师面试失败经历,其中提到了我回答关于Xgboost的部分,评论区的老哥就开始了...

2020-01-20 21:01:00 820

转载 如何看待国内开源现状?贾扬清、李沐、陈天奇等大牛如是说

选自知乎机器之心报道陈天奇、李沐、贾扬清、老师木等人如何看待国内开源现状?这篇文章也许能为 AI 社区的开发者们提供洞见。近年来,「开源」成为了国内科技公司对外传播技术实力的热门词汇。特...

2020-01-19 11:32:00 610

转载 知识图谱基本概念&工程落地常见问题

作者:cavities来源:https://zhuanlan.zhihu.com/p/62824358编辑:happyGirl简要说明一下,搞了知识图谱架构一年半,快两年的一些小心得,后...

2020-01-18 21:01:00 1171

转载 一文了解 Text-to-SQL

作者:哈工大SCIR 窦隆绪,潘名扬,乔振浩简介Text-to-SQL系统能够将自然语言描述转化成对应的SQL查询语句,这项技术能够有效地辅助人们对海量的数据库进行查询。因此,该项研究引...

2020-01-18 21:01:00 4514

转载 机器学习论文推荐 | 2019 Reddit最受喜欢的5篇AI论文

By 超神经内容一览:回顾 2019 年,人工智能领域时有大事发生,吸引着各界人士的关注。这一年,也诞生了数篇优质论文。我们收集了 Reddit 上网友 2019 最喜欢的论文,供大家一...

2020-01-17 20:43:00 835

转载 50道练习实践学习Pandas!

DatawhaleDatawhale,和鲸社区编辑Pandas 是基于 NumPy 的一种数据处理工具,该工具为了解决数据分析任务而创建。Pandas 纳入了大量库和一些标准的数据模型,...

2020-01-16 09:18:00 2188

转载 60题PyTorch简易入门指南,做技术的弄潮儿!

DatawhaleDatawhale,和鲸社区编辑PyTorch是一个基于Python的库,提供了一个具有灵活易用的深度学习框架,是近年来最受欢迎的深度学习框架之一。未经授权,禁止转载。...

2020-01-15 18:23:16 1401

转载 这100道练习,带你玩转Numpy

DatawhaleDatawhale,和鲸社区编辑Numpy是Python做数据分析所必须要掌握的基础库之一。以下为入门Numpy的100题小练习,原为github上的开源项目,由和鲸社...

2020-01-14 20:28:07 1992

转载 自动机器学习新进展!性能超过人类调参师6个点,AutoGluon 低调开源

机器之心报道机器之心,Datawhale编辑自动机器学习效果能有多好?比如让 MobileNet1.0 backbone 的 YOLO3 超过 ResNet-50 backbone 的 ...

2020-01-13 21:01:00 1095

转载 数据探索很麻烦?推荐一款强大的特征分析可视化工具:yellowbrick

前言玩过建模的朋友都知道,在建立模型之前有很长的一段特征工程工作要做,而在特征工程的过程中,探索性数据分析又是必不可少的一部分,因为如果我们要对各个特征进行细致的分析,那么必然会进行一些...

2020-01-13 21:01:00 1253 1

转载 清华刘知远:好的研究想法从哪里来?

作者 | 刘知远来源 |知乎https://zhuanlan.zhihu.com/p/93765082临近ACL 2020投稿截止时间,跟同学密集讨论,争论哪些研究想法适合投到ACL有...

2020-01-12 21:01:00 884

转载 吴恩达《Machine Learning》Jupyter Notebook 版笔记发布!图解、公式、习题都有了

在我很早之前写过的文章《机器学习如何入门》中,就首推过吴恩达在 Coursera 上开设的《Machine Learning》课程。这门课最大的特点就是基本没有复杂的数学理论和公式推导,...

2020-01-12 21:01:00 493

转载 非准确率至上,这些趋势在2020年的AI领域更受关注

选自venturebeat机器之心编译参与:魔王、一鸣AI 领域最杰出的头脑如何总结 2019 年技术进展,又如何预测 2020 年发展趋势呢?本文介绍了 Soumith Chintal...

2020-01-10 09:15:00 394

转载 北大30岁女博导获2019 IEEE青年成就奖,全球仅三人,深耕微纳电子、神经形态计算...

机器之心报道参与:张倩、蛋酱、泽南在 2019 年 IEEE 青年成就奖的颁奖典礼上,全球共有 3 位研究者获奖,来自北大的黄芊芊就是其中一位。她是亚洲地区的唯一获奖者,也是该奖项设立以...

2020-01-09 09:35:04 720

转载 机器学习面试的12个基础问题,强烈推荐!

选自Medium作者:JP Tech等机器之心编译毕业季找工作了?如果想应聘机器学习工程师岗位,你可能会遇到技术面试,这是面试官掂量你对技术的真正理解的时候,所以还是相当重要的。近日,J...

2020-01-09 09:35:04 1132

转载 时间序列入门教程,从理论到业务实践,Kaggle kernels Master 整理分享

一、前言最近逛了逛Kaggle,发现了一个非常详细的时间序列教程。里面记载了很多关于时间序列的知识,并且一直在updating中。可以看到这个教程已经被观看了6w多次。点赞700+, c...

2020-01-08 09:10:00 379

转载 清华姚班毕业生开发新特效编程语言,99行代码实现《冰雪奇缘》,网友:大神碉堡!创世的快乐...

边策 鱼羊 发自 凹非寺量子位 报道 | 公众号 QbitAI只用99行代码,你也可以像《冰雪奇缘》里的艾莎公主一样拥有冰雪魔法。虽然你不能在现实世界中肆意变出魔法,但却能在计算机的虚拟...

2020-01-08 09:10:00 411

转载 深入理解LightGBM

本文主要内容概览:1. LightGBM简介GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树...

2020-01-07 09:25:00 622

转载 天池算法赛:数据挖掘经典赛事!DCIC 2020 数字中国创新大赛启动!

2020数字中国创新大赛(Digital China Innovation Contest, DCIC2020),以“培育数字经济新动能,助推数字中国新发展”为主题,采取多赛道并行的竞赛...

2020-01-06 09:30:00 2253 1

转载 代码工具 | 数据清洗,试试这 8套Python代码

原作 Kin Lim Lee乾明 编译整理量子位 出品 | 公众号 QbitAI数据清洗,是进行数据分析和使用数据训练模型的必经之路,也是最耗费数据科学家/程序员精力的地方。这些用于数据...

2020-01-05 09:30:00 369

转载 智源&计算所-互联网虚假新闻检测挑战赛(冠军)方案,开源分享

比赛链接为https://www.biendata.com/competition/falsenews/比赛由智源研究院和中科院计算所主办,比赛平台为biendata。冠军模型可以访问...

2020-01-05 09:30:00 3277 4

转载 告别2019:属于深度学习的十年,那些我们必须知道的经典

选自leogao.dev作者:Leo Gao,机器之心参与:一鸣、泽南、蛋酱2020 新年快乐!当今天的太阳升起时,我们正式告别了上一个十年。在这十年中,伴随着计算能力和大数据方面的发展...

2020-01-04 09:30:00 144

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材 而掌握算法和数据结构是拿到好offer必备的核心技能!

2018-08-22

机器学习_数学基础_精选教材(概率,线代,微积分)

普林斯顿微积分读本高清中文版 概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作,和国内同济版相比,通俗易懂,易于自学。 奠定机器学习数学基础,三本教材就够了!!!

2018-08-09

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集 主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除