第1134期AI100_机器学习日报(2017-10-26)

AI100_机器学习日报 2017-10-26

@好东西传送门 出品,由@AI100运营, 过往目录 见http://geek.ai100.com.cn

订阅:关注微信公众号 AI100(ID:rgznai100,扫二维码),回复“机器学习日报”,加你进日报群

微信公众号:rgznai100

本期话题有:

全部18 算法9 深度学习8 自然语言处理6 资源6 应用4 视觉4 语音3 会议活动3 经验总结2

用日报搜索找到以前分享的内容: http://ml.memect.com/search/

今日焦点 (5)

机器之心Synced 网页版 2017-10-26 17:13

算法

【专栏 | 从架构到算法,详解美团外卖订单分配内部机制】美团点评日前完成最新一轮融资,估值达到300亿美元。此轮融资后将会在人工智能、无人配送等前沿技术研发上加大投入。但我们并不是为技术而技术,事实上,人工智能技术已经在支撑着我们众多业务场景。 http://t.cn/RWCplfX
开发者头条 网页版 2017-10-26 17:30

张鲁鲁

一文读懂集成学习(附学习资源) http://t.cn/RW9mF53 by 张鲁鲁 分享自 @jifei 开通的独家号《机器学习与大数据》 http://t.cn/Rfpgmag (想看更多?下载 @开发者头条 App: http://t.cn/RJyDMlJ ) ​

ChatbotsChina 网页版 2017-10-26 14:36

深度学习 资源 课程 吴恩达

吴恩达Deeplearning.ai 全部课程学习心得分享 @机器之心Synced http://t.cn/RW9Apom

ChatbotsChina 网页版 2017-10-26 10:08

深度学习 自然语言处理

用深度学习(CNN RNN Attention)解决大规模文本分类问题 – 综述和实践 http://t.cn/RWKfC65

爱可可-爱生活 网页版 2017-10-26 05:17

算法 自然语言处理 Jason Brownlee 机器翻译 神经网络

【(Keras)神经网络机器翻译编解码器序列-序列模型定义】《How to Define an Encoder-Decoder Sequence-to-Sequence Model for Neural Machine Translation in Keras | Machine Learning Mastery》by Jason Brownlee http://t.cn/RWoYfg3

最新动态

2017-10-26 (10)

稀土掘金 网页版 2017-10-26 17:56

会议活动 视觉 ICCV 会议

ICCV 2017计算机视觉顶级会议掘金专题[小黄人高兴]来掘金看原文→ http://t.cn/RWCodDL

宜远智能 网页版 2017-10-26 16:31

会议活动 深度学习 GPU 行业动态 会议

我们#宜远智能#联合香港浸会大学GPU高性能实验室,在5月份参加了总奖金100万,阿里巴巴&Intel举办的天池医疗AI大赛[第一季]:肺部结节智能诊断。 在第一赛季的​线下GPU平台,我们用Pytorch在全球2887支队伍中获得第2名(这版代码暂时只会内部使用)。在第二赛季的线上指定的CPU平台,使用定制的Intel…全文: http://m.weibo.cn/2325927652/4167138450939947…全文: http://m.weibo.cn/2325927652/4167138450939947

wx:让创新获得认可 网页版 2017-10-26 16:22

公告板 架构 经验总结 入门 深度学习 视觉 算法 应用 资源 自然语言处理 Matthew Tovbin Spark SVM Xiaohan Zeng Yangqing Jia Yann Lecun 博客 分类 行业动态 机器人 集成学习 聚类 决策树 课程 社交网络 神经网络 书籍 特征工程 统计 信息检索 招聘

「五天面试硅谷五个科技巨头并斩获全部Offer后,他分享了这些心得经验…」 来源:Medium作者:Xiaohan Zeng 故事的开始是由于笔者觉得目前的工作成长空间有限,同时不想继续呆在芝加哥想到湾区去寻求一些机会。人生苦短,想到就做!结果在五天内疯狂面试了硅谷的五个科技巨头——LinkedIn、Salesforce、Google、Airbnb和Facebook,并斩获了所有的offer!希望他的准备和面试经历能让正在找工作或者想要寻求新机会的你看到不同公司的共性和特点,并有所启发和思考。Enjoy~ 准备阶段 作者面试并获得Offer的五家公司分别是LinkedIn,Google,Facebook,Salesforce以及Airbnb,面试岗位分别是机器学习工程师、软件工程师和数据工程师,由于岗位的领域和要求不同所以作者在编程、机器学习和系统设计三个领域进行了准备。 编程虽然编程面试不能完全反应一个人的综合能力,但是我们也必须承认没有更好的方法在短时间内判断一个开发人员的能力了,所以对于编程需要进行一些必要的练习。 作者主要使用了Leetcode和Geekforgeeks来进行练习,但也推荐了Hackerrank和Lintcode两个练习资源。作者进行了几个星期的数据结合和算法练习,主要集中于自己不熟悉的方面,同时做了一些较为常见的题目,一般每天练习两道编程题。 下面是作者的心得:1. 练习,不断练习,关于编程的技能没有捷径;2. 作者并没有把网站上的题目全部做一遍,而是挑出了其中的70题来进行练习,作者认为如果真的弄懂了70题的解题思路和完整的方法就足够了,不在多在精!3. 先从最难的题目开始,那么后面的都会越来越简单;4. 如果卡在一题上太久,那就果断的参考答案的解决方法,更多的时间并不会获得更多的回报;5. 在解决问题后,要参考答案的解决方法对照自己的方法,很多时候你会为别人的方法拍案叫绝!6. 使用一种你最熟悉同时大家都常用的语言,方便与人沟通交流。 系统设计 这一部分与作者原先的工作比较接近,作者介绍了在这类面试中经常会问道的问题包括:系统架构、面向对象的设计、数据机制设计、分布式系统设计、大规模运算等等; 在网络上有很多资源可以帮助我们进性这方面的准备,作者主要阅读了系统设计面试、大规模系统架构、案例学习等方面的文章,下面是一些推荐的资源: http://blog.gainlo. 作者认为虽然系统设计面试会覆盖很广的问题,但是依旧有一些主线和规律可循,下面是他的经验分享:1.首先要明确需求,随后进行顶层设计,再进一步进入实施的细节。不要再一开始就不顾需求的一头扎入技术细节中去;2.世界上没有完美的系统,实际的系统都是在各方面的要求权衡后得出的。 但对于系统设计来说,最好的方式还是实际的设计一个系统。例如在日常工作中除了完成工作外,对于你所使用的工具、架构和库进行更深入的了解。如果你在使用HBase,那么不要仅仅是利用客户端运行一些简单的命令,而是尝试去理解它的整体架构,包括读写流的表达、如何确保连续性,最小最大压缩是如何进行的、系统中如何使用LRU缓存和Bloom滤波器。你甚至可以对HBase和Cassandra进行一些比较,看看他们之间架构的相似和差异。这样当面试官让你设计一个分布式的关键存储时,你就可以从容的面对。 很多博客是不错的学习资源,包括Hacker Noon和一些工作的工程师博客,同时也不要忘了开源工具的开发文档。但最重要的事情,是保持一颗谦虚但好奇的心,像海绵一样学习吸收你周围的知识! 机器学习机器学习的面试可以分为理论和产品设计两个部分。 除非你是机器学习专业的同学,那么详细学习机器学习方面的教材和参考书是十分必要的,例如经典的《Elements of Statistical Learning and Pattern Recognition and Machine Learning 》,如果你对其中一些问题感兴趣的话,可以进行深入的阅读。 机器学习方面你需要确保对于一些基本概念熟练掌握,包括偏差-方差的权衡、过拟合、梯度下降、L1/L2正则化、贝叶斯理论、boost方法、协方差、降维等等。同时也要熟悉一系列公式,包括贝叶斯理论和支持向量机这类比较普遍的模型,并自己尝试着练习实现一些模型,例如决策树、K均值聚类等。如果在简历中写入了什么模型,你一定要对这个模型了然于心。 对于机器学习的产品设计,你需要了解通常的产品开发流程:1.找出产品开发的目标:预测、推荐还是聚类、搜索?2.挑选一种合适的算法:监督或者非监督、分类还是回归?线性模型/决策树/还是神经网络等等,要能拿出选择的理由;3.对数据进行特征工程;4.对于模型表现进行度量和评价;5.在产品层面对模型进行进一步优化。 作者再一次强调了学习的好奇心以及连续性的重要性,不要仅仅是调用一下各个机器学习的API,而是真正的去理解后面的原理是什么,去了解为什么随机梯度下降适合于分布式训练、XGBoost与传统的GBDT有何不同,在比如损失函数的特征是什么,为什们需要进行二阶微分等等。 面试过程 作者先是在领英上与HR通信,了解各个公司的需求,随后进行了几个月的准备工作。随后到湾区进行了一个星期的面试,面了30多家顶级的科技公司,并最终拿到了其中的五家Offer。 电话面试每家公司的电话面试都是标准的流程、唯一不同的地方就是持续时间的长短。在电话面试中,对于专业技能的熟练程度十分重要,因为时间有限,而且很多时候只有一次机会。你要非常迅速的识别出问题的类型并给出高质量的答案。同时需要告诉面试官你的想法和思路,毕竟面试中沟通和交流是最重要的。记住,不要去背答案,面试官一眼就会看穿你的。对于机器学习的公司来说,在面试中你需要向他们展示出你的机器学习技能。 同时需要把握好你的时间,作者在一天下午安排了三场电话面试,但是这有利有弊,可能你可以在先前的面试中得到更多的自行,但也有可能被先前的不顺利所影响,所以这种方式因人而异。同时面试多家公司的好处在于可以在有限的时间内尽可能多的参与面试,甚至可以跳过某些公司的第二论电话面试,直接进入终面。最令人意外的是谷歌,他们在知道作者这一周有其它四场面试的时候甚至省略了所有的电话面试,直接进入现场面试!作者欣然接受,虽然很累,但是谁也不会拒绝Google的邀请吧! 现场面试(Onsite)LinkedIn这是我第一个到他们Sunnyvale办公室现场的面试。办公室很整洁,人们看起来也很专业。 每个面试的时长是一个小时。编程问题是都是比较常规的,但ML的问题可能会有点棘手。在这之前,我收到了一封来自HR的邮件,里面包含了一些非常有用的准备材料,所以有了思想准备面试也就平稳飘过。我早就听说LinkedIn拥有硅谷最好的伙食,实际也是数一数二。 微软的收购似乎已经解决了LinkedIn的财务负担,并把他们解放出来去做真正酷的事情。视频和专业广告等新功能是令人兴奋的。作为一家专注于专业发展的公司,LinkedIn把自己员工的成长摆在了优先考虑的位置。许多团队,如广告相关性和新闻流排序组都正在招兵买马中,所以如果你想加入的话,赶紧行动起来。 Salesforce Einstein AI计划“摇滚”明星团队的摇明星项目。这个团队很新,感觉很像一个创业公司。该产品构建在Scala堆栈上,所以类型安全是一个真实的东西!我在他们的Palo Alto办公室面试过。团队有凝聚力的文化,工作生活的平衡非常好。每个人都对自己正在做的事情充满激情,而且真的很享受。与其他Onsite相比,四次会议的时间相对短一些,我感觉都没有呆够。面试结束后,Matthew Tovbin还带我去了惠普的车库散步
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值