自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。

  • 博客(31)
  • 资源 (5)
  • 收藏
  • 关注

转载 新手入门:Kaggle NLP比赛总结

一、背景介绍很早就想入坑 kaggle NLP 类比赛,记得最初是跟着教程跑入门赛 Bag of Words Meets Bags of Popcorn,被一步步的文本预处理搞得心累,...

2020-03-31 12:24:22 1967

转载 阿里机器学习算法面经(已offer)

作者|Ivyoake整理|NewBeeNLP今天上午已收到意向书,岗位算法工程师-机器学习,地点杭州。一面(简历面 半小时)当时在过马路时收到...

2020-03-30 19:56:00 1479 1

原创 数据科学教育白皮书联合发布!顶级数据人才成长路径

Datawhale原创联合发布:和鲸科技、腾云大学、AWS、Datawhale寄语:为什么要加快推进高校的数据科学教育?数据科学的知识体系包括哪些内容?...

2020-03-27 19:50:00 2263

转载 深入理解计算机视觉中的损失函数

导读损失函数在模型的性能中起着关键作用。选择正确的损失函数可以帮助你的模型学习如何将注意力集中在数据中的正确特征集合上,从而获得最优和更快的收敛。计算机...

2020-03-26 19:57:00 2097

转载 让数据分析更便捷快速,了解这12种Numpy和Pandas函数

选自TowardsDataScience作者:Kunal Dhariwal机器之心编译我们都知道,Numpy 是 Python 环境下的扩展程序库,支持...

2020-03-26 19:57:00 392

转载 机器学习竞赛必备基础知识_Word2Vec

1简介本文我们主要介绍词嵌入中一种非常经典的算法,Word2Vec,早期Word2Vec主要被用在文本类的问题中,但是现在做比赛的朋友应该都发现了,...

2020-03-25 19:56:00 738

转载 我从吴恩达 AI For Everyone 中学到的十个重要 AI 观

作者|LeeMeng整理|NewBeeNLP写在前面在这个人机共存的年代,每个人都应该去尝试了解并运用人工智慧这个超能力,思考自己未来在这个变...

2020-03-25 19:56:00 443

原创 图像分类经典项目:基于开源数据集Fashion-MNIST的应用实践

Datawhale作者:何新,Datawhale优秀学习者简介:何新,武汉理工大学硕士https://github.com/whut2962575697...

2020-03-24 19:56:43 2617

转载 一份面向工程师的Google面试指南!GitHub 9.8万星高赞,中文版发布

晓查 发自 凹非寺量子位 报道 | 公众号 QbitAI一位从1997年就入行的Web工程师,立志要成为Google软件工程师,3年前写下了一篇超完整...

2020-03-23 19:55:00 556

转载 不容错过的Pandas小技巧:万能转格式、轻松合并、压缩数据,让数据分析更高效...

点击上方“Datawhale”,选择“星标”公众号第一时间获取价值内容作者 | Roman Orac转自 | 量子位 编译|鱼羊数据分析,如...

2020-03-22 19:57:00 991

转载 别再喊我调参侠!“科学炼丹”手册了解一下

这是一篇写给萌新的“科学炼丹”手册。前言很多小伙伴现在已经把机器学习、深度学习的理论基础打好了,但是真正要解决一个现实中的算法问题的时候经常两手抓瞎,一...

2020-03-20 19:56:00 1558 1

转载 「最全」实至名归,NumPy 官方早有中文教程,结合深度学习,还有防脱发指南...

机器之心报道参与:一鸣、JaminNumPy 无疑是很多机器学习研究者和开发者的「白月光」。如此优秀的项目,没有中文版怎么行?近日,机器之心发现 Num...

2020-03-19 20:03:44 500

原创 数据挖掘组队学习

Datawhale学习主办:Datawhale 天池寄语:本次数据挖掘专题组队学习,旨在理论结合实践,帮助学习者掌握数据挖掘相关知识,提升在实际场景中的...

2020-03-18 19:53:00 787

转载 论文必备:如何用卡片法写论文?

王树义读完需要18分钟速读仅需 6 分钟横看成岭侧成峰,远近高低各不同。1 疑问读了我的《如何高效实践卡片式写作?》之后,有读者提出了疑问:王老师,...

2020-03-17 20:00:21 1229

转载 十分钟了解算法面经:百度,寒武纪,作业帮,科大讯飞等常面问题

作者|Miss整理|NewBeeNLP面试锦囊之面经分享系列。PS.这篇文章中的公司我也都有面过,问题真的差不多甚至一模一样,所以面经分享还是...

2020-03-15 19:51:33 1310

原创 二分类问题:基于BERT的文本分类实践!附完整代码

Datawhale作者:高宝丽,Datawhale优秀学习者寄语:Bert天生适合做分类任务。文本分类有fasttext、textcnn等多种方法,但在...

2020-03-14 19:30:00 6068 3

转载 集成模型Xgboost!机器学习最热研究方向入门,附学习路线图

导读:本文介绍了集成学习中比较具有代表性的方法,如Boosting、Bagging等。而XGBoost是集成学习中的佼佼者,目前,一些主流的互联网公司如...

2020-03-14 19:30:00 1365

转载 如何优雅地训练大型模型?

前阵子微软开源了DeepSpeed训练框架,从测试效果来看有10倍的速度提升,而且对内存进行了各种优化,最大可以训练100B(illion)参数的模型。...

2020-03-13 19:55:00 2082 1

原创 NLP入门之路及学习方法:从任务实践入手!

Datawhale原创作者:康兵兵,Datawhale成员寄语:NLP入门,科学有效的方法是找到切入点,一个具体任务。从任务实践入手,做到既见树木也见森...

2020-03-12 20:00:00 1213

转载 拒绝跟风,谈谈几种算法岗的区别和体验

图片大概是因为马上要开始秋招提前批了,小夕在知乎和微信后台收到了不少小伙伴的岗位/团队选择的求助。于是小夕这里写一篇扫盲贴,给即将毕业的师弟师妹们提供一个参考(后面再有师弟师妹问我这个问...

2020-03-11 20:00:00 754

转载 提高 GPU 训练利用率的Tricks

前言首先,如果你现在还是在进行session.run(..)的话!尤其是苦恼于GPU显存都塞满了利用率却上不去的童鞋,这篇文章或许可以给你打开新世界的大门噢如果发现经过一系列改良后训练效...

2020-03-08 19:52:29 2349 2

原创 深度学习中的优化算法串讲

Datawhale原创作者:谢文睿,Datawhale成员寄语:优化算法是一个超参数,一个优化算法不是适合所有损失函数的,没有哪个优化算法是绝对的好或绝对的坏,是要根据损失函数判断的本文...

2020-03-07 20:00:00 709

转载 你离开学只差这个视频:李宏毅机器学习2020版正式开放上线

机器之心报道参与:思、Jamin2020 年的机器学习和过去有一些不一样的地方:首先,这一门课增加了很多作业。台大李宏毅老师的机器学习课程可以说是最具代表性的中文公开课之一,已成为大量国...

2020-03-06 20:26:56 184

转载 结营答辩!28天!Datawhale助力公益AI一起学,点亮最暖寒假!

创新公益28天前,为抵抗疫情,高校学子纷纷驻守在家,不能返校、不能去图书馆。在家如何高效学习,应对科研升学、求职就业的挑战?我们觉得,大家需要一门好课,也需要好的学习氛围,更需要从学习...

2020-03-06 20:26:56 251 1

转载 透过现象看本质,图解支持向量机

选自towardsdatascience作者:Rohit Pandey机器之心编译作者说:我以前一直没有真正理解支持向量机,直到我画了一张图。1. 问题支持向量机(SVM)旨在解决「分类...

2020-03-05 20:00:00 422

转载 有必要将所有机器学习算法都实现一遍吗?

点击上方“Datawhale”,选择“星标”公众号第一时间获取价值内容来源:知乎整理:louwill链接:https://www.zhihu.com/question/36768514作...

2020-03-04 20:08:24 888

转载 教程 | 算法太多挑花眼?教你如何选择正确的机器学习算法

选自Hackernoon作者:Rajat Harlalka机器之心编译机器学习算法虽多,却没有什么普适的解决方案。决策树、随机森林、朴素贝叶斯、深度网络等等等等,是不是有时候觉得挑花了眼...

2020-03-03 20:01:12 769

转载 从Transformer到BERT模型

目录:ELMo与Transformer的简单回顾DAE与Masked Language ModelBERT模型详解BERT模型的不同训练方法如何把BERT模型应用在实际项目中如何对BER...

2020-03-02 20:00:00 958

转载 一行代码都不写!Github 博客小白版入门教程

赖可 发自 凹非寺量子位 报道 | 公众号 QbitAIGitHub不仅可以传代码,还可以建博客。利用GitHub Pages平台,就可以搭建非常好用的个人博客。但是难点在于,你在要敲很...

2020-03-02 20:00:00 558

转载 83篇文献-万字总结强化学习之路

深度强化学习实验室报道作者:侯宇清,陈玉荣编辑:DeepRL深度强化学习是深度学习与强化学习相结合的产物,它集成了深度学习在视觉等感知问题上强大的理解能力,以及强化学习的决策能力,实现了...

2020-03-01 19:55:51 1427

转载 【白话机器学习】算法理论+实战之决策树

1. 写在前面如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的, 常见的机器学习算法:监督学习算法:逻辑回归,线性回归,决策树,朴素贝叶斯,K近邻,支持向量机,...

2020-03-01 19:55:51 1541

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材 而掌握算法和数据结构是拿到好offer必备的核心技能!

2018-08-22

机器学习_数学基础_精选教材(概率,线代,微积分)

普林斯顿微积分读本高清中文版 概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作,和国内同济版相比,通俗易懂,易于自学。 奠定机器学习数学基础,三本教材就够了!!!

2018-08-09

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集 主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除