自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。

  • 博客(41)
  • 资源 (5)
  • 收藏
  • 关注

转载 如何高效读论文?剑桥CS教授亲授“三遍论”:论文最多读三遍,有的放矢,步步深入...

鱼羊 编译整理量子位 报道 | 公众号 QbitAI嗑盐之始,在于读论文。一方面,把握最前沿的研究动态,激发自身研究灵感。另一方面,不做好文献调研,自己的绝妙想法变成了重复造轮子,这种体...

2019-12-31 09:25:00 237

转载 《生成式对抗网络GAN的研究进展与展望》论文笔记

本文主要是对论文:王坤峰, 苟超, 段艳杰, 林懿伦, 郑心湖, 王飞跃. 生成式对抗网络GAN的研究进展与展望. 自动化学报, 2017, 43(3): 321-332.进行总结。相...

2019-12-31 09:25:00 4384

转载 详解Python 3.8的海象算子:大幅提高程序执行效率

选自Medium作者:Animesh Gaitonde机器之心编译参与:Panda前几个月发布的 Python 3.8 包含了一项重要的新功能,即海象算子。如果合理运用,该算子能有效地提...

2019-12-30 09:25:00 800

转载 2019年的最后一个月,这里有6种你必须要知道的最新剪枝技术

选自heartbeat.fritz.ai作者:Derrick Mwiti机器之心编译参与:魔王、蛋酱对于剪枝技术,你了解多少?这里有一份秘籍,整理了 2019 年度的 6 篇论文所提到的...

2019-12-29 10:00:00 446

转载 机器学习最有价值的6个经验教训

作者:James Warner编译:ronghuaiyang导读机器学习是未来,因为它将广泛应用于计算机和其他领域。尽管如此,开发有效的机器学习应用需要大量的“黑魔法”,这在手册中很难找...

2019-12-28 14:04:00 287

转载 Python趣味打怪:60秒学会一个例子,147段简单代码助你从入门到大师 | 中文资源...

鱼羊 发自 凹非寺量子位 报道 | 公众号 QbitAI人生苦短,编程苦手,不妨学起Python,感受一飞冲天的快乐。不要害怕学习的过程枯燥无味,这里有程序员jackzhenguo打造的...

2019-12-28 14:04:00 338

转载 《数据竞赛白皮书》发布:竞赛核心价值及促进人才数字化转型

近年来,“数据竞赛”已经成为大数据与人工智能领域的热门话题。据不完全统计,2014年开始,全球赛事超1000场,仅中国的竞赛场次年均增长达108.8%,累计超120万人次参加,奖金累计达...

2019-12-27 12:04:00 654

转载 《数据竞赛白皮书·下篇》发布,开源办好一场数据竞赛的实践方法论

两周前,我们发布了《数据竞赛白皮书·上篇·1000场竞赛的深度分析》,通过28000字的研究分析、54个高品质图表,讲透了数据竞赛行业发展,带领大家看懂了竞赛高热度背后的逻辑。上篇发布后...

2019-12-27 12:04:00 253

转载 深入理解XGBoost,优缺点分析,原理推导及工程实现

本文的主要内容概览:1. XGBoost简介XGBoost的全称是eXtreme Gradient Boosting,它是经过优化的分布式梯度提升库,旨在高效、灵活且可移植。XGBoos...

2019-12-26 20:04:00 85578 5

转载 绝对干货!NLP预训练模型:从transformer到albert

文章作者:Serendipity内容来源:Serendipity的知乎,已通过作者授权整理编辑:happyGirl,浅梦背景语言模型是机器理解人类语言的途径,17年的transforme...

2019-12-25 20:04:00 1188

转载 Python数据可视化:5段代码搞定散点图绘制与使用,值得收藏

导读:什么是散点图?可以用来呈现哪些数据关系?在数据分析过程中可以解决哪些问题?怎样用Python绘制散点图?本文逐一为你解答。作者:屈希峰来源:大数据DT(ID:bigdatadt)0...

2019-12-24 20:04:00 1943

转载 干货 | XGBoost在携程搜索排序中的应用

作者简介曹城,携程搜索部门高级研发工程师,主要负责携程搜索的个性化推荐和搜索排序等工作。一、前言在互联网高速发展的今天,越来越复杂的特征被应用到搜索中,对于检索模型的排序,基本的业务规...

2019-12-23 20:04:00 246

转载 Pandas | 5 种技巧高效利用value-counts

作者 ParulPandey编译自机器学习算法与Python学习value_counts()value_counts() 方法返回一个序列 Series,该序列包含每个值的数量。也就...

2019-12-22 20:04:00 508

转载 读研三年,值还是不值

北京,2019 年 12 月 摄影| 公子龙文章 | 公子龙2020 年考研报名人数达到了 341 万人,比去年多了五十多万人。这两年,考研的报录比是 4 : 1,相较于前几年的 3...

2019-12-22 20:04:00 416

转载 通过数据分析,了解外国人眼里的真实李子柒

李子柒又火了。分享古风田园生活的短视频频道“李子柒 Liziqi”在YouTube上获得了763万的订阅者,其短视频中传递出静谧、自给自足、远离都市的田园生活理念,赢得了无数外国人的赞赏...

2019-12-21 20:04:00 3878 1

转载 超生动图解LSTM和GPU,一文读懂循环神经网络!

作者 Michael Nguyen王小新 编译自 Towards Data Science量子位 出品 | 公众号 QbitAIAI识别你的语音、回答你的问题、帮你翻译外语,都离不开一种...

2019-12-21 20:04:00 456

转载 我在华为做外包的真实经历!

1写在前面我将用系列文章,回顾十年程序生涯,一方面是对职场生涯的阶段性总结,另一方面希望这些经历,对大家往后职场生涯有所启发。我很庆幸一路走来皆是自己的选择,虽然也走了不少弯路,但那是我...

2019-12-20 09:20:00 2999

转载 在非互联网公司?!算法工程师的工作内容及心得建议

【导语】网上已经有很多在互联网公司工作的算法工程师的日常了,那么小编便来说说在咨询公司,身为算法工程师,工作是一种什么样子的体验,同时也为对咨询感兴趣的小伙伴指明点方向。具体内容:工作内...

2019-12-19 09:30:00 1027

转载 漫画 | 大数据风控从业者的一天

看过码农的一天...看过算法工程师的一天...终于轮到了,大数据风控从业者的一天...警告,内容过于真实,可能引起极度舒适。风风火火抵达公司。果然,美好的一天从迟到开始,可陆家嘴周围...

2019-12-19 09:30:00 983

转载 12篇文章带你进入NLP领域,掌握核心知识

专栏《NLP》第一阶段正式完结了。在本专栏中,我们从NLP中常用的机器学习算法开始,介绍了NLP中常用的算法和模型;从朴素贝叶斯讲到XLnet,特征抽取器从RNN讲到transforme...

2019-12-18 10:00:00 369

转载 谈谈计算机行业的秋招和春招

杭州钱塘江畔,2019 年 12 月摄影 |公子龙文章 |公子龙刚刚结束的秋招中,有人欢喜有人忧。欢喜的是,有些同学找到了不错的工作;忧愁的是,也有同学没有心仪的去处。秋招和春招,是...

2019-12-17 09:21:33 1832

转载 Python数据分析之Pandas读写外部数据文件

点击上方“Datawhale”,选择“星标”公众号第一时间获取价值内容阅读目录1 引言2 文本文件(txt、csv)2.1 读取数据2.2 写入数据3 excel文件3.1 读取数据3....

2019-12-17 09:21:33 1815

转载 爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!...

数据竞赛中baseline是最入门的分享,它不仅有思路、方法还有内容;或许你与Top选手的差距就是一个baseline!01项目介绍如果你是数据竞赛的初学者、爱好者,比赛的baselin...

2019-12-16 09:15:00 805

转载 经验总结!我们是如何在编程面试中挂掉的

作者:Michael Lazarski编译:张晶晶阅读编程题目不够细致有时一字之差就会完全改变要求原意,或许你在第一时间并未领会该词要义,又或许以为自己领会到了,然而实际上未必。改进:...

2019-12-15 21:10:38 327

转载 2020年国际学术会议参考列表

IJAC年度重磅分享:2020重要国际学术会议列表,涵盖机器学习、人工智能、计算机视觉、模式识别、自动控制、机器人几大领域,部分未列入表格的会议,或未正式发布会讯,或为两年至三年举办一次...

2019-12-15 21:10:38 7730 1

转载 风控特征—关系网络特征工程入门实践

“本文业务角度分享了风控业务中构建关系特征的一些实践经验,包括数据源分析,关系网络和特征的构建,特征性能的评估以及线上方案的落实。”作者:求是汪在路上来源:知乎专栏 风控模型算法。编辑...

2019-12-14 21:00:00 1032

转载 解读 | 2019 年 10 篇计算机视觉精选论文(上)

By 超神经内容一览:2019 年转眼已经接近尾声,我们看到,这一年计算机视觉(CV)领域又诞生了大量出色的论文,提出了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力。因此,...

2019-12-13 20:51:59 315

转载 机器学习萌新必学的 Top10 算法

点击上方“Datawhale”,选择“星标”公众号价值内容第一时间获取来源:量子位在机器学习领域里,不存在一种万能的算法可以完美解决所有问题,尤其是像预测建模的监督学习里。比方说,神经...

2019-12-13 20:51:59 205

转载 样本生而不等——聊聊那些对训练数据加权的方法

现有大部分机器学习或者深度学习的研究工作大多着眼于模型或应用,而忽略对数据本身的研究。今天给大家介绍的几个文章就关注于在机器学习中如何通过对训练集的选择和加权取得更好的测试性能。在开始之...

2019-12-12 20:00:00 2368

转载 如何高效入门 PyTorch ?

王树义读完需要15分钟速读仅需5分钟PyTorch 入门,坑着实不少。咱们来谈谈,如何选个合适的教程,避开它们。1 选择好几位读者,都留言问我:王老师,我想学深度学习,到底是该学 T...

2019-12-10 20:04:35 278

原创 一文总结Datawhale系列分享

点击上方“Datawhale”,选择“星标”公众号第一时间获取价值内容学习路线完备的 AI 学习路线,最详细的资源整理!关于数据科学家的成长指南这是关于如何成为一名AI算法工程师的长文干货!推荐算法工程师学习路线及工作指南秋招准备,GitHub万星的ML算法面试大全机器学习成才之路:GitHub高赞的学习路径开源项目《周志华机器学习详细公式推导版》...

2019-12-09 19:34:23 786

转载 撒花!《交互式线性代数》完整版正式发布!支持在线全交互式体验(含源码,离线也能看)...

线性代数是机器学习的基础,也是重难点。而一般线性代数教程大多是是枯燥乏味的。今天给大家带来一份《交互式线性代数》教程。它的最大特点就是“交互式”。这份线性代数教程有在线版,网址为:htt...

2019-12-08 20:10:50 555

转载 一文讲解机器学习算法中的共线性问题

多重共线性是使用线性回归算法时经常要面对的一个问题。在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参与,这种建模机制含有抗多重共线性干扰的功能;后者干脆...

2019-12-08 20:10:50 1486

转载 combo:机器学习模型合并工具库

点击上方“Datawhale”,选择“星标”公众号第一时间获取价值内容机器学习中的模型合并(model combination)可以通过合并多个模型达到提升性能与稳定性的目的。模型合并往...

2019-12-07 17:00:00 864

转载 一些真诚的学习经验和生活感悟

学习经验首先分享一下自己在学习技术的过程中的一些经验啦,这些也是自己在学习的过程中慢慢总结出来的,希望对大家有所启发。持续学习当前互联网发展太快了,我们可以发现现在很多技术更迭太快。比如...

2019-12-06 09:00:00 649

转载 年度盘点!必看AI顶会论文、Github高星项目大合集(附链接)

目前,国外计算机界评价学术水平主要是看在顶级学术会议上发表的论文,特别是在机器学习、计算机视觉和人工智能领域,顶级会议才是王道。本期我们盘点了2019年人工智能领域的顶会,如最核心的顶会...

2019-12-05 17:00:00 1230

转载 看完知乎轮子哥的编程之路,我只想说,收下我的膝盖...

点击上方“Datawhale”,选择“星标”公众号第一时间获取价值内容作者:vczh来源:https://dwz.cn/sWwZoQElvczh,本名陈梓瀚,因知乎的个人信息介绍上写有“...

2019-12-05 17:00:00 483

转载 90%的人会遇到性能问题,如何用1行代码快速定位?

阿里妹导读:在《如何回答性能优化的问题,才能打动阿里面试官?》中,主要是介绍了应用常见性能瓶颈点的分布,及如何初判若干指标是否出现了异常。今天,齐光将会基于之前列举的众多指标,给出一些常...

2019-12-04 20:00:00 708

转载 一行代码将Pandas加速4倍

作者:George Seif编译:ronghuaiyang导读虽然Pandas的功能非常强大,但是对于大数据集来说,确实是很慢的。虽然 panda 是 Python 中用于数据处理的库,...

2019-12-04 20:00:00 397

转载 机器学习中特征选择怎么做?这篇文章告诉你

点击上方“Datawhale”,选择“星标”公众号第一时间获取价值内容来源|AI开发者简 介据《福布斯》报道,每天大约会有 250 万字节的数据被产生。然后,可以使用数据科学和机器...

2019-12-03 19:30:00 1087 2

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材 而掌握算法和数据结构是拿到好offer必备的核心技能!

2018-08-22

机器学习_数学基础_精选教材(概率,线代,微积分)

普林斯顿微积分读本高清中文版 概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作,和国内同济版相比,通俗易懂,易于自学。 奠定机器学习数学基础,三本教材就够了!!!

2018-08-09

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集 主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除