自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 收藏
  • 关注

翻译 【译文】数据科学的统计学入门

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可对于未处在定量领域中的有志数据科学家们,学习统计学可是条令人胆寒的不归路。不论你是个计算机工程专业的大学生,寻找事业新出路的开发人员还是个MBA研究生,似乎在数据科学中最让大家觉得害怕的部分总是统计学。至少对从商学院毕业的我来说,它确实是。统计学是门严肃的学科,很多人穷尽一生来学习研究它。作为一个上进的数据科学家,要如何在统计学

2016-07-05 08:06:48 1133

翻译 【译文】深度神经网络入门手册

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可深度神经网络(DNNs)是拥有多层感知器的架构,用来解决复杂的学习问题。然而,DNNs在训练和概括中面临挑战。传统的DNNs互联的大量数据可能会过拟合,需要不同的训练方法来提高泛化。神经网络权重的前训练(pretrain)和神经网络新品种旨在克服这些问题。尤其是卷神经网络,被设计用于处理图像,通过最小化可训练的重量并提供强大的泛化能力。

2016-07-05 08:05:51 1232

翻译 【译文】如何利用机器学习和分布式计算来对用户事件进行分类

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可作者:Natalino Busa机器学习,特别是聚类算法,可以用来确定哪些地理区域被一个给定的用户经常访问和“入住”而哪些区域不是。这样的地理分析使范围广泛的服务成为可能,从基于位置的推荐系统到先进的安全系统,并提供更个性化的用户体验。在这篇文章中,我将确定特定的地理区域,从个人到每个用户,看看如何从众多的定位请求中通过

2016-07-05 08:04:44 2283

翻译 马上要参加数据工程师面试?花一分钟看看这个速读书籍列表!

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可。作者:Joseph Lee我在这里想推荐一些我个人认为对我的面试很有帮助的书籍,在NYCDSA网站分享给大家。Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Stu

2016-07-05 08:03:33 1028

翻译 【译文】城市相似性的可视化:美国和冰岛的相似之处

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可作者:Karim Heredia这篇博文揭示了如何找到城市相似性的另一种方法。认真阅读之后,你就会明白为什么我会觉得麦迪逊(美国城市)和雷克雅未克(冰岛首都)竟会是两个非常相似的城市了。 Teleport Cities这个应用让你能够对世界上任何一个有趣的城市进行研究,并且你可以使用它所提供的一个复杂而又

2016-07-05 08:01:43 1954

原创 【投稿】Machine Learing With Spark Note 3:构建分类器

本文为数盟特约作者投稿,欢迎转载,请注明出处“数盟社区”和作者博主简介:段石石,1号店精准化推荐算法工程师,主要负责1号店用户画像构建,喜欢钻研点Machine Learning的黑科技,对Deep Learning感兴趣,喜欢玩kaggle、看9神,对数据和Machine Learning有兴趣咱们可以一起聊聊,个人博客: hacker.duanshishi.com Sp

2016-07-05 08:00:21 1437 3

原创 【投稿】Machine Learning With Spark Note 2:构建简单的推荐系统

本文为数盟特约作者投稿,欢迎转载,请注明出处“数盟社区”和作者博主简介:段石石,1号店精准化推荐算法工程师,主要负责1号店用户画像构建,喜欢钻研点Machine Learning的黑科技,对Deep Learning感兴趣,喜欢玩kaggle、看9神,对数据和Machine Learning有兴趣咱们可以一起聊聊,个人博客: hacker.duanshishi.com推荐引擎应用场

2016-07-05 07:58:32 1877

原创 【投稿】Machine Learning With Spark Note 1:数据基本处理

本文为数盟特约作者投稿,欢迎转载,请注明出处“数盟社区”和作者博主简介:段石石,1号店精准化推荐算法工程师,主要负责1号店用户画像构建,喜欢钻研点Machine Learning的黑科技,对Deep Learning感兴趣,喜欢玩kaggle、看9神,对数据和Machine Learning有兴趣咱们可以一起聊聊,个人博客: hacker.duanshishi.com接入公共数据库

2016-07-05 07:57:20 812

翻译 【译文】人工智能给伦敦带来了它的大脑和经济收益

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可随着两大以学术界为基础的AI创业公司被美国科技公司收购,资本正逐渐成为年轻的科学家-企业家的中心。在伦敦的帝国理工学院深处,一台电脑正在学习如何玩“吃豆人”。和人类一样,它很拼命想获得这款1980年代经典游戏的第一名。随着时间的流逝,它所学习到的经验可以帮助它决定哪些策略可以使它逃离无情的幽灵的魔爪。 这

2016-07-05 07:56:23 525

翻译 31个与大数据有关的非常不错的资源和文章(附全链接)

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可摘自Vincent Granville http://dataunion.org/22600.html资源1.用贝叶斯模型计算我的妻子是否怀孕2.在基础R中使用插值法和平滑功能3.数据兵工厂里的武器:R vs Spark 【这个链接好像挂了~】4.最好的大数据、数据科学、数据挖掘和机器

2016-07-05 07:54:12 781

翻译 【译文】物联网:实施与挑战

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可Ahmed Banafa物联网(IoT)是物理对象——设备、车辆、建筑和其他对象的网络,其中嵌入了电子、软件、传感器和网络连接,使这些对象能收集和交换数据,实施这一概念不是一项仅靠一些措施就能完成的简单任务,其原因在于物联网生态系统的不同组成部分具有复杂的性质。为了了解这项任务的复杂性,我们将解释实施物联网的五个组成部分。

2016-07-05 07:50:56 522

翻译 走近麻省理工学院的神秘科技:大数据分析自动化

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可。这套取代人的直觉与算法的系统,优于906个人类团队中的615个团队。作者:Larry Hardesty | 麻省理工学院新闻办公室October 16, 2015大数据分析包括寻找有某种预测能力的埋藏模式。但是,选择哪些数据的“特征”来进行分析通常需要靠人类的直觉。在一个包含数据库中,举个例子,各种促销

2016-07-04 13:14:53 1686

转载 专访百度吴恩达:深度学习能给一个公司带来什么价值

近日,吴恩达接受了Strategy+Business的采访,由于Strategy+Business主要是一家关注公司的管理和经营策略的杂志,因此采访也主要偏向于人工智能的商业化应用。不过这也给了我们一个很好的机会从另一个角度来看待AI,尤其是发现AI在实用性、商业化等方面的种种可能性。在采访中吴恩达解释了百度目前对深度学习在商业化方面的应用情况、深度学习在整个商业中的应用前景,对未来的展望,尤其是

2016-07-04 13:13:41 1019

转载 Hadoop 3.0纠删码:能节省一半存储空间!

随着大数据技术的发展,HDFS作为Hadoop的核心模块之一得到了广泛的应用。为了系统的可靠性,HDFS通过复制来实现这种机制。但在HDFS中每一份数据都有两个副本,这也使得存储利用率仅为1/3,每TB数据都需要占用3TB的存储空间。随着数据量的增长,复制的代价也变得越来越明显:传统的3份复制相当于增加了200%的存储开销,给存储空间和网络带宽带来了很大的压力。因此,在保证可靠性的前提下如何提高存

2016-07-04 13:13:12 1929 3

翻译 关于反爬虫,看这一篇就够了

编者:本文来自携程酒店研发部研发经理崔广宇在第三期【携程技术微分享】上的分享,以下为整理的内容概要。墙裂建议点击视频回放,“现场”围观段子手攻城狮大崔,如何高智商&高情商地完美碾压爬虫。。。关注携程技术中心微信公号ctriptech,可第一时间获知微分享信息~你被爬虫侵扰过么?当你看到“爬虫”两个字的时候,是不是已经有点血脉贲张的感觉了?千万要忍耐,稍稍做点什么,就可以在名义上让他们胜利,

2016-07-04 13:12:27 50786 7

转载 12亿条出行记录背后的纽约故事

纽约出租车和轿车委员会(NYC Taxi and Limousine Commission,简称TLC)在其网站上公开了纽约整个城市从2009年1月到2015年12月、共12亿条出租车出行记录(压缩前数据量大约200GB)。这些数据详细记录了每一趟出租车上下客的时间和地理位置(精确到经纬度)、出行距离、出行费用、支付方式以及司机上报的乘客数量。出租车作为城市发展、社会变迁的见证者,其活动轨迹提供了

2016-07-04 13:11:54 1403

翻译 Little Explanations#2-为递归神经网络编码文本

本文为数盟原创译文,转载时请务必注明出处为“数盟社区”,并将原文链接置于文首。作者V. Alexander Saulys最近我对文本的生成感起了兴趣。随着微软在推特上新开发的人工智能又成为热门(尽管不是什么好消息),我发现解释一个基本的递归神经网络是如何接受输入指令并产生输出倒是一件很有意思的事。我将会解释在这种递归神经网络中文本是如何进行输入和分析,而

2016-07-04 13:10:11 622

翻译 Little Explanations #1 -神经网络与模型压缩

本文为数盟原创译文,转载时请务必注明出处为“数盟社区”,并将原文链接置于文首。作者:V. Alexander Saulys前言:这是我对Singular Distillations的技术解释部分的全部内容。我将每年出版一次我对一些论文的解读。我相信,有些是相当复杂的,其他的则需要简单解释。我会将那些令我印象深刻文章向所有对它们好奇的人展示出来。我们最近很少会直接使用模型了。

2016-07-04 13:09:38 895

翻译 玩转深度学习法的13家顶尖公司

本文为数盟原创译文,转载时请务必注明出处为“数盟社区”,并将原文链接置于文首。作者:Kevin Murnane我们收集数据的手段在很大程度上超过了我们用来分析这些数据的工具。其结果是,大量的非结构化的和很难获取的信息是我们从社交媒体、应用程序的权限、网站的浏览痕迹以及硬件和软件服务协议中收集到的。这是座黄金山,但需要正确的工具来得到它。对于许多应用程序,深度学习就是那个正确的工具。

2016-07-04 13:09:04 3038

翻译 2016数据科学报告:数据科学家依然受追捧

本文为数盟原创译文,转载时请务必注明出处为“数盟社区”,并将原文链接置于文首。出品方:CloudFlower前言我们的《2016数据科学家报告》是去年的努力的后续行动。我们的目的是调查有着多年经验和专业领域的专业数据科学家,从而了解他们的职业,以及他们每天的日常工作是怎样的。我们的发现非常有趣。对创业公司而言,数据科学家把多数时间花在做他们不喜欢做的事。然而,他们中

2016-07-04 13:08:09 486

翻译 基于树的建模-完整教程(R & Python)

本文为数盟原创译文,转载时请务必注明出处为“数盟社区”,并将原文链接置于文首。简介基于树的学习算法被认为是最好的方法之一,主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型,它们映射非线性关系相当不错。他们善于解决手头的任何问题(分类或回归)。决策树方法,随机森林,梯度增加被广泛用于各种数据科学问题。因此,对于每一个分析

2016-07-04 13:07:23 4186

翻译 面试干货!21个必知数据科学面试题和答案part2(12-21)

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可这里是第二部分,就从我给大家准备的“特别提问”开始吧。作者 Gregory Piatetsky, KDnuggets. 特别提问:解释什么是过拟合,你如何控制它这个问题不是20问里面的,但是可能是最关键的一问来帮助你分辨真假数据科学家!回答者:Gregory Piatetsky 过

2016-07-04 12:54:30 3931

翻译 面试干货!21个必知数据科学面试题和答案part1(1-11)

本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可KDnuggets编辑给你“20个问题来分辨真假数据科学家”的答案,包括什么是正则化、我们崇拜的数据科学家、模型验证等等。作者 Gregory Piatetsky, KDnuggets.最近KDnuggets上发的“20个问题来分辨真假数据科学家”这篇文章非常热门,获得了一月的阅读量排行首位。但是这些问题并没有提

2016-07-04 12:53:26 648

原创 2016全球大数据战略版图剖析(1):架构篇

本文为数盟原创文章,转载时请注明出处为“数盟社区”。http://dataunion.org/wp-content/uploads/2016/02/2016BigDataLandScape.png上图是2016大数据版图英文完整版。为了更好的使大家了解行业现状,我们整理出了对应公司的中文介绍,以飨读者。本次介绍的公司为如图所示的部分公司,请悉知:基础

2016-07-04 12:51:55 3999

原创 2016全球大数据战略版图剖析(2)

本文为数盟原创文章,转载时请注明出处为“数盟社区”。http://dataunion.org/wp-content/uploads/2016/02/2016BigDataLandScape.png上图是2016大数据版图英文完整版。为了更好的使大家了解行业现状,我们整理出了对应公司的中文介绍,以飨读者。本次介绍的公司为如图所示的部分公司,请悉知:7.

2016-07-04 12:51:08 3346

原创 2016全球大数据战略版图剖析(3):分析篇

本文为数盟原创文章,转载时请注明出处为“数盟社区”。为了更好的使大家了解行业现状,我们整理出了2016大数据版图英文对应公司的中文介绍,以飨读者。若与前文重复,则不再列出。本次介绍的公司为如图所示的部分公司,请悉知:分析1.分析员平台Palantir一家培养初创公司的初创公司。硅谷的科技公司Palantir科技,拥有近90亿美元估值,和在过去十年中接

2016-07-04 12:49:35 7053

原创 2016全球大数据战略版图剖析(4):分析篇下

本文为数盟原创文章,转载时请注明出处为“数盟社区”。9.实时Metamarkets公司是日益流行的纲领性广告分析软件、广告交流、广告销售和广告买家的创业公司,其刚刚曝光了最新的1500万美元的资金消息。这家创业公司Metamarkets得到了迅速提高其收入和客户数量的机会,发展进入了正轨,一切都在向好的方向发展。Metamarkets公司为不同类型的广告公司提供了不

2016-07-04 12:47:52 3656

原创 2016全球大数据战略版图剖析(5):应用篇

本文为数盟原创文章,转载时请注明出处为“数盟社区”。http://dataunion.org/wp-content/uploads/2016/02/2016BigDataLandScape.png上图是2016大数据版图英文完整版。为了更好的使大家了解行业现状,我们整理出了2016大数据版图英文对应公司的中文介绍,以飨读者。若与前文重复,则不再列出。本次介绍的公司为

2016-07-04 11:48:16 2941

原创 2016全球大数据战略版图剖析(6):应用篇下

本文为数盟原创文章,转载时请注明出处为“数盟社区”。http://dataunion.org/wp-content/uploads/2016/02/2016BigDataLandScape.png上图是2016大数据版图英文完整版。为了更好的使大家了解行业现状,我们整理出了2016大数据版图英文对应公司的中文介绍,以飨读者。若与前文重复,则不再列出。本次介绍的公司为

2016-07-04 11:40:45 2017

翻译 构建你的独家TensorFlow模型

本文为数盟原创译文,转载时请注明出处为“数盟社区”。在TensorFlow上定义你的模型可以很容易建成一个巨大的代码墙。如何用一个具有可读性和可重复使用的方法来构建你的代码?对于你的inpacient,这里是一个到工作示例依据的链接。定义计算图为每个模型划分类别是合理的。类别的接口是什么?通常情况下,你的模型连接到一些输入数据和目标的占位符,并提供培训和考核操作。

2016-07-04 11:35:00 1729

原创 2016全球大数据战略版图剖析(7):跨基础设施/分析篇

本文为数盟原创文章,转载时请注明出处为“数盟社区”。http://dataunion.org/wp-content/uploads/2016/02/2016BigDataLandScape.png上图是2016大数据版图英文完整版。为了更好的使大家了解行业现状,我们整理出了2016大数据版图英文对应公司的中文介绍,以飨读者。若与前文重复,则不再列出。本次介绍的公司为

2016-07-04 11:32:27 1195

翻译 对Python的深度学习库Theano的介绍

本文为数盟原创译文,转载时请注明出处为“数盟社区”。Theano是一个Python库,可以在CPU或GPU上运行快速数值计算。这是Python深度学习中的一个关键基础库,你可以直接用它来创建深度学习模型或包装库,大大简化了程序。在这篇文章中,你会发现Theano Python库。 Theano是什么?Theano是在BSD许可证下发布的一

2016-07-04 11:30:49 1423

原创 2016全球大数据战略版图剖析(8):数据资源/API篇

本文为数盟原创文章,转载时请注明出处为“数盟社区”。http://dataunion.org/wp-content/uploads/2016/02/2016BigDataLandScape.png上图是2016大数据版图英文完整版。为了更好的使大家了解行业现状,我们整理出了2016大数据版图英文对应公司的中文介绍,以飨读者。若与前文重复,则不再列出。本次介绍的公司为

2016-07-04 11:28:41 1716

翻译 分布式TensorFlow:在Spark上将谷歌的深度学习库进行尺度变换

本文为数盟原创译文,转载请注明出处为“数盟社区”。介绍Arimo的日益增长的数据科学团队包括研究和开发机器学习和深入学习新的方法和应用。我们正在调查的一个主题是分布式的深度学习。当数据集和模型非常大时,我们就会发现与深度学习相融合的模式和预测值的价值和品种。然而,如果数据或模型不适合机器的内存,培养大型模型可能就会很慢或很难。我们高兴地看到谷歌开源了TensorFlow深度

2016-07-04 11:26:02 10644 1

翻译 使用TensorFlow创建自己的手写识别引擎

本文为数盟原创译文,转载请注明出处为“数盟社区”。这篇文章介绍了使用TensorFlow创建自己的手写识别引擎的简单方法。在这里作为示例示出的项目。完整的源代码可以登录GitHub https://github.com/niektemme/tensorflow-mnist-predict/介绍我正在进行一篇机器学习的文章的写作。现在写这个话题就难以忽视TensorF

2016-07-04 11:22:53 8339 2

翻译 一个可以创建任何艺术家风格的电影的神经网络

本文为数盟原创译文 转载请注明出处为数盟社区深度神经网络,不仅通过他们的AI能力给人们留下深刻印象,也包括他们的艺术能力。最新的工作可以实现任何艺术家的风格,并且可以把现有的视频转换成这种风格。你必须看到它并且相信它。神经网络是擅长分类的。例如,你可以使用一个训练过的神经网络将输入图像变形为一个可参考的绘画风格。其结果是,这个照片看起来好像是艺术家画出来的。Kand

2016-07-04 11:12:32 880

翻译 “深度学习”真的比我们想象中“浅”很多吗?

【本文为数盟社区原创译文】最近一个有趣的公共对话已经呈现出了人工智能(AI)的最新发展状况,其中既有乐观的观点也有悲观的观点,赢得了相当数量的媒体的关注。那么这个即将广泛通用的人工智能,到底是如斯蒂芬·霍金、伊隆·马斯克和比尔·盖茨近年来所提出的观点那样是灾难性的,还是像Ray Kurzweil和许多人所认为的,它会带来前所未有的超级智能代理服务以解决人类实际面临的所有问题?从某种

2016-07-04 11:08:51 765

翻译 12个机器学习的关键点及阐释

本文为数盟原创译文,请注明出处为数盟社区By Matthew Mayo, KDnuggets.随着人工智能(AI)技术对各行各业有越来越深入的影响,我们也更多地在新闻或报告中听到“机器学习”、“深度学习”、“增强学习”、“神经网络”等词汇,对于非专业人士来说略为玄幻。这篇文章为读者梳理了包括这些在内的 12 个关键词,希望帮助读者更清晰地理解,这项人工智能技术的内涵和潜能。

2016-07-04 11:05:32 656

转载 谷歌人工智能系统TensorFlow开始支持iOS

数盟综合报道   6月8日消息,据国外媒体报道,谷歌人工智能软件系统TensorFlow昨日放出0.9版初步预览版本。该版本开始增加对iOS系统的支持,此举或意味着苹果用户在未来不久的时间里也将能体验到曾在围棋大战中战胜李世石的“神经网络”人工智能的强大之处。人工智能成为硅谷企业的心头好已经很很多年,各大公司(包括Facebook、微软、eBay、IBM)都在幕后投入了不少的精力去研发。

2016-07-04 11:01:04 803

翻译 2016年4月计算机视觉,机器学习和人工智能中的亮点和新发现

本文为数盟原创译文,转载请注明出处为数盟社区在这个月经系列的第四个问题中,你会发现Qualcomm是如何把深度学习和AI引向智能设备,为什么戴姆勒发送自驾卡车到所有欧洲各地,如何模仿伦勃朗在深度学习的帮助下最好的工作,还有更多。 下一个伦勃朗从史密森传来的消息,一个必须要看的迷人的视频,关于使用伦勃朗的作品中超过168,000个数据片段,并按照伦勃朗的标志性风格培养

2016-07-04 10:54:54 840

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除