- 博客(27)
- 资源 (151)
- 收藏
- 关注
原创 庆生Hadoop 10周岁,五大神分享最新技术、生态和应用(含PPT下载)
1月29,Hadoop 10周年生日之际,CSDN主办的“Hadoop英雄会——暨Hadoop 10周年生日大趴”在北京举行,汇聚热爱开源,热爱大数据,热爱Hadoop的技术人,共同为Hadoop庆生(不方便来到现场的朋友也可以扫描文章最后的二维码通过Hadoop微信群进行更多的交流)。中科院计算所副研究员、中国大数据技术大会(原Hadoop in China)发起人查礼,Hulu高级研发工程师董...
2016-01-30 09:11:27 333
原创 虚拟现实+:第三方引擎 VS 原创引擎
作者:曾戈VR的三个痛点画面的粗糙感,即晶格。VR不同于传统视界,其画面极大,且视觉需要达到全眼覆盖,画面一个很小的瑕疵在受众眼中会放大数倍,这会是一个很差的体验。VR内容的渲染帧率不够,会带来眩晕感。在理论上画面渲染帧率过低,或者像素点对输入信号的反应速度不够,都会导致拖影效果。国外普遍的标准认为,VR需要达到90帧才算及格。内容却严重不足。目前VR硬件厂商积极呼吁产业发展,开发者却与玩家...
2016-01-28 11:26:49 615
原创 高级搜索树+深度增强学习,Google DeepMind AI算法击败欧洲围棋冠军
纵横十九道,棋子无大小,平均150回合的比赛,最大有3^361 种局面(大致为10^170),围棋一直被视为人工智能(AI)的最大挑战之一,但Google旗下的DeepMind声称其AI算法已经掌握了比赛。据Nature报道,DeepMind宣布其程序AlphaGo击败了欧洲围棋冠军樊麾,五战五胜,没有任何让子。DeepMind引以为傲的是AlphaGo并非基于规则的程序,而是以机器学习算法取胜。...
2016-01-28 09:22:17 512
原创 移动、NLP、机器学习推动SaaS智能客服市场发展
1月26日,易观国际发布了《中国SaaS客服市场专题研究报告2015》,报告中预测:到2017年,中国SaaS客服市场交易规模将增长至680亿元人民币,并将继续保持平稳增长。移动互联时代人力成本的上升、移动互联网技术的普及、移动社交场景的出现、自然语言处理和机器学习技术的进步,共同推动了SaaS智能客服市场的发展。近两年,专门提供SaaS客服的厂商纷纷崛起,自2014年大量投资者进入到SaaS客服...
2016-01-27 16:35:39 787
原创 H2O.ai首席架构师:深度学习的普及还有两大障碍
RE•WORK市场总监Sophie Curtis与分布式可扩展开源机器学习平台H2O.ai的首席架构师、开源代码库主要committer之一Arno Candel的对话:哪些行业受深度学习上影响最大? 物联网时代的到来导致数十亿的设备以某种人工智能的形式运行。无论是农业的产量控制系统,零售业的个性化推销,公用事业的家庭自动化,金融领域的P2P借贷,还是汽车行业的自动驾驶,我们即将见证深学习技术...
2016-01-27 16:01:39 1086
原创 用Spark+ TensorFlow训练和应用深度学习模型
Tim Hunter在databricks博客发布博文,演示如何使用TensorFlow和Spark一起训练和应用深度学习模型。两个use cases:超参数调整:用Spark找到神经网络训练的最佳超参数,减少10倍的训练时间,降低34%的误差率。大规模部署模型:利用Spark在大量数据上应用一个训练的神经网络模型。训练的超参数,如每层的神经元、学习率,太多或者太少都不行。TensorFlo...
2016-01-26 22:43:50 5214 2
原创 THUCTC:清华大学NLP实验室推出的中文文本分类工具
官方介绍: THUCTC(THU Chinese Text Classification)是由清华大学自然语言处理实验室推出的中文文本分类工具包,能够自动高效地实现用户自定义的文本分类语料的训练、评测、分类功能。 文本文类通常包括特征选取、特征降维、分类模型学习三个步骤。如何选取合适的文本特征并进行降维,是中文文本分类的挑战性问题。该组根据多年在中文文本分类的研究经验,在THUCTC...
2016-01-26 15:13:28 3488
原创 物联网设备安全&隐私基本准则
安全默认安全设备之间不会共享默认密码,或采用弱密码。所有的密码应该由高品质的随机数生成器随机产生。关闭用户很少使用的高级功能应(如VPN,远程管理等)。安全设计固件应该被锁定以使串行连接不可用。应该使用安全元件(SE)或者受信任的保护模块(TPM)设备来保护固件和硬件的访问。生产版本应该禁用硬件上所有的GPIO、UART和JTAG接口。NAND或其它存储器/存储介质应用环氧树...
2016-01-26 14:38:45 264
原创 Facebook开源Transform软件
VR需要大量的360度全景视频,Transform能将普通的方形视频转变为3D立方体,这种方法能将视频体积压缩25%。 算法公布在Github:https://github.com/facebook/transform...
2016-01-25 16:34:25 341
原创 阿里云解析数加平台:图形化机器学习,支持100+人协同开发
阿里云在1月20日的2016云栖大会上海峰会上发布一站式大数据平台“数加”,首批亮相20款产品。阿里云大数据事业部资深总监徐常亮称,“数加”在技术上至少领先业界三年。“数加”包括数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等几个层面。数据采集Datahub是数加上的一款数据采集产品,可为用户提供实时数据的发布和订阅功能。写入的数据可直接进行流式数据处理,也可参与后续的离线作业计算。D...
2016-01-22 23:06:13 614
原创 数据可视化:基于阿里云DataV的“郡县图治”
阿里云介绍,其大数据平台“数加”中包含一款针对中国县域经济的数据应用产品“郡县图治”,能让每个县域的管理者实时的了解区域的经济态势、产业特点、内需消费等关键数据的走势,为政府决策提供支持。“郡县图治”使用了阿里云DataV数据可视化技术(没错,就是支持阿里双十一大屏的技术)做支撑。阿里云工程师表示,这款产品无需进行任何的编程,只需进行简单的部署、参数设置、数据连接,便可让枯燥的统计数据直观的呈现出...
2016-01-22 22:44:30 1049
原创 1月20日Yoshua Bengio在Quora上的问答记录
1月20日Yoshua Bengio在Quora上的问答记录 by 陈汝丹问题目录: 1. 什么是深度学习? 2. 深度学习在沿着什么样的方向发展? 3. 2015年读过最好的机器学习paper? 4. 距离了解为什么深度学习有效还有多远? 5. 深度学习研究的领域有哪些? 6. 为什么bengio认为当前机器学习算法限制在于它们需要足够多的数据来学习? 7. 为什么无监督重要? ...
2016-01-21 10:58:16 232
原创 MSRA实习生林添总结:从NIPS 2015看机器学习三大趋势
今年NIPS上最新的研究成果中透视出当下机器学习的三大趋势:神经网络架构的进一步复杂化;自动推断和黑盒学习技术的新发展;对概率推断的新认知。原文:http://blog.sina.com.cn/s/blog_4caedc7a0102w4tz.html...
2016-01-21 10:45:17 307
原创 云栖大会:阿里云推数加平台,首批集中发布20款产品
1月20日,阿里云在2016云栖大会上海峰会上发布了一站式大数据平台“数加”,首批亮相20款产品,包括分析型数据库、流计算、机器学习算法、个性化推荐引擎、智能语音交互、文字识别等,涵盖数据采集、计算引擎、数据加工、数据分析、数据应用等数据生产全链条。阿里云大数据事业部资深总监徐常亮表示,基于数加平台的开放能力,阿里云计划用3年时间吸引1000家合作伙伴入驻,培养1000名首席数据官,50000名数...
2016-01-20 12:06:26 230
原创 视频:使用Web标准构建IoT系统(英)
物联网软件公司EVRYTHNG的两位联合创始人——研发执行副总裁 Vlad Trifa 和 CTO Dominique Guinard 共同概述一种 IoT 方法——Web of Things (WoT),使用真实世界的设备演示这种方法如何不同于 IoT,以及它如何用于描述元数据,属性,或者任何物理对象的命令。链接:Building IoT systems with Web standards...
2016-01-19 21:23:44 140
原创 IBM Watson Analytics与微软Azure Machine Learning的比较
对于IBM最近发布的用于数据探索、可视化和预测分析的平台Watson Analytics的一个beta版本,UCSD(加州大学圣迭戈分校)计算机科学 PhD Zachary Chase Lipton 撰文 IBM Watson Analytics vs. Microsoft Azure Machine Learning (Part 1) ,将其与微软Azure Machine Learning进行...
2016-01-19 21:01:46 567
原创 机器学习工具综述
原作者:Jason Brownlee工具是机器学习的重要组成部分,选择合适的工具与使用最好的算法同等重要。在这篇文章中,你将会见识到各种机器学习工具。了解它们为什么重要,以及可供选择的工具类型。为什么要使用工具机器学习工具使得应用机器学习更快,更简单,更有趣。更快:好工具可以自动化应用机器学习过程中的每一步。这意味着,从提出创意到得到结果的时间大大缩短。如果你从头开始自己实现每一个功能,这花的时...
2016-01-19 06:39:46 486
原创 工业物联网:56家颠覆工厂,石油领域和供应链的创业公司
当前由传统科技巨头GE,IBM和Cisco引领的工业物联网的浪潮正改变着重资产工业。随着连接设备如Nest和Sonos进入主流,物联网已经变成了近20年来最热门的科技趋势之一。据我们数据统计,物联网创业公司在过去的6年中吸引了累计74亿美元的风险投资。物联网不仅仅在家庭及消费级设备取得发展。像制造业,物流,矿业,石油,公用设施和农业等重资产行业也开始应用物联网系统,以提高生产效率和产出。随着物联网...
2016-01-18 09:55:21 1152
原创 余凯对话MIT CSAIL 总监Daniela Rus:机器人制造流程改进、自动驾驶及女性工程师...
在极客公园创新大会(GIF2016)上,MIT计算机科学与人工智能实验室(MIT’s Computer Science and Artificial Intelligence Laboratory )总监Daniela Rus对话地平线机器人科技公司创始人兼CEO余凯,并接受媒体记者的采访,就人工智能、机器人/自动驾驶等技术的前沿研究及应用进展等话题分享了自己的观点。Daniela Rus首先发表...
2016-01-17 11:04:11 663
原创 Google产品管理副总裁Lior Ron:技术洞察+用户洞察让小产品走向世界
在极客公园创新大会(GIF2016)上,Google产品管理副总裁Lior Ron发表题为《后移动时代》的主题演讲,并接受记者采访,畅谈产品创新的成功因素,以及Google在Google Map(Lior Ron曾负责Google Map产品)、无人驾驶、IoT等领域的研究。关于创新创新没有统一的答案。创新的关键就是,你要不断地、重新地发现,重新地发明。Google有非常好的企业文化允许员工犯错...
2016-01-16 23:25:04 260
原创 针对IoT分析问题的开放方法论
关注大数据、IoT、智慧城市的数据科学家、英国牛津大学教授Ajit Jaokar认为,类似Ignite IoT这样的IoT方法论并未涉及到IoT分析的详情,他总结了一套构建IoT分析的方法论。IoT分析(IoT数据科学)的方法论应涵盖数据科学的每一步的独特之处。例如:它不止于模型家族的选择,ANN、SVM、决策树等模型的选择只是许多选择中的一个,其他的选择包括:模型结构的选择 - 最优化方法(C...
2016-01-14 22:33:33 312
原创 使用平台实现物联网ASIC设计
物联网(IoT)现在的炒作正在逐步成为现实,这反过来给从现成的芯片设计转移到定制芯片创造了机会。为物联网制造高性价比可定制芯片的关键是使用平台的做法。客观地说,物联网现在的炒作越来越火。物联网生态系统活动在过去几年有明显的增加,包括终端客户,硬件和软件供应商,系统集成商和初创社区。是的,毫无疑问,物联网正在一步步地实现。虽然没有达到原先预期的速度期,到2020年也肯定无法达到500亿设备或1万亿传...
2016-01-14 09:10:46 331
原创 颜水成:深度学习、Baby Learning与人工智能
深度学习(Deep Learning)当前的成功离不开与大数据的结合,但从业者也渴望摆脱对大量标注样本的依赖。颜水成(YAN Shuicheng),奇虎360首席科学家、360人工智能研究院院长,曾任新加坡国立大学电子与计算机工程系的Dean’s Chair Associate Professor,提出了模拟婴儿自学习逐步获取知识的Baby Learning方法,对于学习模型的自我增强与自我适应非...
2016-01-13 08:42:39 1151
原创 应用深度学习时需要思考的问题
对于应用深度学习需要思考什么的问题,我们无法统一答复,因为答案会随着你要解决的问题的不同而不同。但是我们希望以下的问答将成为一个帮助你如何在初期选择深度学习算法和工具的清单。我的问题是有监督类型还是无监督类型?如果是有监督类型的,是分类还是回归?有监督学习会有个“老师”, 它会通过训练数据集的形式,在输入和输出的数据之间建立相关性。例如,给图片设定标签,对于分类问题,输入的数据是原始像素,输出的...
2016-01-12 08:48:37 208
原创 速度的权衡:物联网数据分析何时需要超级计算机?
物联网的设备和传感器会产生许多数据,分析这些数据获取可行性见解将会有远大的发展前景。在许多企业满足于使用小额的投资,慢条斯理地进行数据分析的同时,那些需要进行及时和复杂的数据分析的企业正从超级计算机工业的快速成长和进步中获益。来自于Cray公司高级副总裁兼首席策略官Barry Bolding的建议:当数据分析的时效性是关键因素时,企业应该考虑选择超级计算资源方案来进行数据分析。Bolding 说:...
2016-01-07 11:17:06 172
原创 深度学习:推动NLP领域发展的新引擎
文 / 雷欣,李理从2015年ACL会议的论文可以看出,目前NLP最流行的方法还是机器学习尤其是深度学习,所以本文会从深度神经网络的角度分析目前NLP研究的热点和未来的发展方向。我们主要关注Word Embedding、RNN/LSTM/CNN等主流的深度神经网络在NLP中的应用,这已经是目前主流的研究方向。此外,已经在机器学习或其它领域比较热门的方法,比如Multi-Model、Reasonin...
2016-01-05 08:58:28 1425
梁堰波-SQL on Hadoop for 10 years
2016-01-30
李建伟:Hadoop新技术介绍
2016-01-30
董西成:Hadoop YARN程序设计与应用案例
2016-01-30
从Attention到Memory与Longer-Term Dependencies研究
2016-01-02
大规模知识图谱的表征学习
2015-12-28
McKinsey物联网价值/趋势/策略研究分析报告
2015-12-26
Making super large-scale machine learning possible
2015-11-07
Data mining for security at Google
2015-11-03
Kubernetes容器监控实践_杨乐(Jack)
2015-11-01
触控Khaos平台经验分享_邓磊
2015-11-01
etcd的高可用实践_ 光音网络王鹏(Tad)
2015-11-01
Kubernetes中的资源管理_丁海洋
2015-11-01
移动搜索研究的知识图谱分析
2015-11-01
百度LSTM建模与CTC训练_贾磊
2015-10-30
Apache Spark在NASA JPL的应用详解
2015-10-30
Hulu的机器学习实践_唐邦晟
2015-10-30
科大讯飞面向感知智能的深度学习平台实践_张致江
2015-10-30
Zeppelin 机器学习最新特性和规划.pdf
2019-06-21
MSRA周明:对话机器人的关键技术
2016-08-30
今日头条李磊:会思考的通用智能机器还有多远?
2016-08-29
北大林宙辰:机器学习一阶算法的优化
2016-08-29
MIT CSAIL Tomaso Poggio:智能科学与智能工程
2016-08-29
微软邓力:驱动大数据人工智能多种应用的三类深度学习模式
2016-08-29
林德康:从搜索引擎到问答引擎再到动作引擎
2016-08-29
Planning Challenges in Human-Machine Collaboration
2016-08-28
诺亚面向语音语义的深度学习研究进展-刘晓华
2016-08-02
张相於《统计机器学习入门——分类1》
2016-07-23
TensorFlow入门教程,从基本概念到实战分析 by 李理|出门问问
2016-07-09
张相於《统计机器学习入门——线性回归》
2016-07-09
张相於《统计机器学习入门——课程介绍&统计学习介绍》
2016-07-09
Google DeepMind的David Silver的强化学习课程讲义
2016-06-20
超限学习机(Extreme learning Machines):筑梦普适学习和普适智能
2016-06-19
微软深度学习的最近进展_微软人工智能首席科学家邓力
2016-04-12
Google Deepmind AlphaGo原理解析(54页PPT详解)
2016-03-14
无监督计算机视觉最新进展
2016-02-05
卢亿雷-Hadoop应用及趟坑
2016-01-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人