自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 大数据技术平台的分类与选择指南

转载请注明出处:大数据技术平台的分类与选择指南大数据的处理过程可以分为大数据采集、存储、结构化处理、隐私保护、挖掘、结果展示(发布)等,各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重。对于互联网大数据而言,由于其具有独特完整的大数据特点,除了共性技术外,采集技术、结构化处理技术、隐私保护也非常突出。有很多算法和模型可以解决这些处理过程中的技术问题,

2017-08-30 10:16:06 1756

翻译 从分布式管理到多租户实现,企业级大数据系统如何利用开源生态构建?

转载请注明出处:从分布式管理到多租户实现,企业级大数据系统如何利用开源生态构建?大数据系统的应用领域首先乐投网小编先跟大家回顾一下历史。从中我们可以看到一些趋势,在大数据生态发展的过程中,大数据系统的管理系统,大数据系统的安全,易用性,机器学习不断的补充到生态系统中来并不断完善。早期是 Google 一家独有。2003 GFS paper 发表的时候

2017-08-28 14:29:42 738

翻译 技术 | 变形卷积核、可分离卷积?卷积神经网络中十大拍案叫绝的操作

转载请注明出处: 乐投网 - 技术 | 变形卷积核、可分离卷积?卷积神经网络中十大拍案叫绝的操作  CNN从2012年的AlexNet发展至今,科学家们发明出各种各样的CNN模型,一个比一个深,一个比一个准确,一个比一个轻量。我下面会对近几年一些具有变革性的工作进行简单盘点,从这些充满革新性的工作中探讨日后的CNN变革方向。 注:下面乐投

2017-08-25 10:08:54 746

转载 如何破解「千人千面」,深度解读用户画像

转载请注明出处:如何破解「千人千面」,深度解读用户画像用户画像的概念大热,众多企业都希望通过“用户画像”驱动产品智能,但什么才是用户画像呢?通过这篇文章,我们介绍我们理解的两种用户画像(User Persona 和 User Profile),以及如何构建用户画像(User Profile)的标签体系并驱动产品智能。User Persona第一种用户画像(U

2017-08-23 14:16:24 4023

原创 「大数据」背后:商业机遇or法律禁区?

转载请注明出处:「大数据」背后:商业机遇or法律禁区?近日,信息泄露事件频发,由此引发的数据产权归属成为焦点。8月10日,京东旗下“京东微联”智能家居应用软件,被指擅自将用户个人wifi密码上传至京东服务器;更早以前,华为新款手机荣耀Magic因收集微信聊天记录,被腾讯控告侵犯腾讯和用户数据。随着“大数据”的崛起,个人隐私与商业应用的边缘却日益模糊。数据到底归于谁?大数据与个人信息

2017-08-18 15:43:07 231

原创 动手实操 | 如何用 Python 实现人脸识别,证明这个杨幂是那个杨幂?

转载请注明出处:动手实操 | 如何用 Python 实现人脸识别,证明这个杨幂是那个杨幂?当前,人脸识别应用于许多领域,如支付宝的用户认证,许多的能识别人心情的 AI,也就是人的面部表情,还有能分析人的年龄等等,而这里面有着许多的难度,在这里我想要分享的是一个利用七牛 SDK 简单的实现人脸识别的方法,当然七牛的 SDK 中提供了很多的拓展,在返回的 JSON 中包含着如年龄等信息

2017-08-17 12:13:11 705

原创 大数据早报:微信开放数据能力 谷歌出手大力整治窃取用户数据应用(8.16)

数据早知道,上乐投网看早报!『共享单车』小蓝单车拟投放变速单车 未来将达总量一半8 月 15 日,小蓝单车正式在全国运营城市中大规模投放“最好骑”的三档变速共享单车 bluegogo pro,预计未来占比将达 50%。 据悉,此举意在响应交通部等十部委于本月下发的《关于鼓励和规范互联网租赁自行车发展的指导意见》。小蓝单车 CEO 李刚表示认同上述《指导意见》,称“产品将

2017-08-16 11:29:05 563

原创 如何提高数据质量?

转载请注明出处: 如何提高数据质量?大数据的时代,数据资产及其价值利用能力逐渐成为构成企业核心竞争力的关键要素;然而,大数据应用必须建立在质量可靠的数据之上才有意义,建立在低质量甚至错误数据之上的应用有可能与其初心南辕北辙背道而驰。因此,数据质量正是企业应用数据的瓶颈,高质量的数据可以决定数据应用的上限,而低质量的数据则必然拉低数据应用的下限。数据质量一般指数据

2017-08-16 11:25:33 10360

原创 一小时快速建立数据分析平台

转载请注明出处:一小时快速建立数据分析平台今天教大家如何搭建一套数据分析平台。它可能是最简单的搭建教程,有一点Python基础都能完成。比起动辄研发数月的成熟系统,借助开源工具,整个时间能压缩在一小时内完成。优秀的数据分析平台,首先要满足数据查询、统计、多维分析、数据报表等功能。可惜很多分析师,工作的第一年,都是埋葬在SQL语句中,以SQL+Excel的形式完成工作,却用不

2017-08-15 15:47:32 538

原创 利用Pytorch进行CNN详细剖析

转载请注明出处:利用Pytorch进行CNN详细剖析  (乐投网 - 大数据,人工智能第一干货网)本文缘起于一次CNN作业中的一道题,这道题涉及到了基本的CNN网络搭建,在MNIST数据集上的分类结果,Batch Normalization的影响,Dropout的影响,卷积核大小的影响,数据集大小的影响,不同部分数据集的影响,随机数种子的影响,以及不同激活单元的影响等,能够让人比较全面地对

2017-08-15 11:13:25 8821

翻译 Apache Kafka:大数据的实时处理时代

转载请注明出处:乐投网 - Apache Kafka:大数据的实时处理时代在过去几年,对于 Apache Kafka 的使用范畴已经远不仅是分布式的消息系统:我们可以将每一次用户点击,每一个数据库更改,每一条日志的生成,都转化成实时的结构化数据流,更早的存储和分析它们,并从中获得价值。同时,越来越多的企业应用也开始从批处理数据平台向实时的流数据数据平台转移。本演讲将介绍最近 Apa

2017-08-09 10:26:20 572

翻译 UC伯克利提出小批量MH测试:令MCMC方法在自编码器中更强劲

转载请注明出处:乐投网 - UC伯克利提出小批量MH测试:令MCMC方法在自编码器中更强劲近日伯克利大学官方博客发文提出小批量 MH(Minibatch Metropolis-Hastings),即一种进行 MH 测试的新方法,该方法根据数据集规模将 MH 测试的成本从 O(N) 减少到 O(1),它不仅对全局统计量没有要求,同时还不需要使用末端限定。伯克利大学使用新型修正分布直接

2017-08-09 10:01:42 909

翻译 谷歌开源DeepLearn.js:可在网页上实现硬件加速的机器学习

转载请注明出处:乐投网 - 谷歌开源DeepLearn.js:可在网页上实现硬件加速的机器学习deeplearn.js 是一个可用于机器智能并加速 WebGL 的开源 JavaScript 库。deeplearn.js 提供高效的机器学习构建模块,使我们能够在浏览器中训练神经网络或在推断模式中运行预训练模型。它提供构建可微数据流图的 API,以及一系列可直接使用的数学函数。

2017-08-09 09:54:00 767

原创 通过NMT训练的通用语境词向量:NLP中的预训练模型?

转载请注明出处:乐投网-通过NMT训练的通用语境词向量:NLP中的预训练模型?自然语言处理(NLP)这个领域目前并没有找到合适的初始化方法,它不能像计算机视觉那样可以使用预训练模型获得图像的基本信息,我们在自然语言处理领域更常用的还是随机初始化词向量。本文希望通过 MT-LSTM 先学习一个词向量,该词向量可以表征词汇的基本信息,然后再利用该词向量辅助其它自然语言处理任务以提升性能。本文先

2017-08-09 09:48:15 3175

转载 《智能数据白皮书》发布:当AI 赋能企业创新,智能数据如何高效驱动营销

根据知名 IT 咨询公司 Gartner 7 月发布了2017年新兴技术成熟度曲线。推出三方面趋势:(1)无处不在的人工智能(AI);(2)透明化身临其境的体验;(3)数字化平台。专注于技术创新的企业将继续寻找可以帮助他们创造竞争优势和价值、降低经营成本、使业务模型转型的新技术。其中,智能数据挖掘(Smart Data Discovery)进入期望膨胀期阶段,2到5年的将成为主流应用新兴技术。

2017-08-09 09:35:10 592

转载 大数据舆情分析:全方位解读《战狼2》

转载请注明出处: 乐投网-大数据舆情分析:全方位解读《战狼2》作者从大数据舆情角度出发,对《战狼2》进行了全方位的解读,文章从全网舆情、微博传播、文本分析三个方面展开。上个月,笔者去电影院看到战狼2分数这么高,9.6分,这在人人审美感官都不同,一部片子总有人喊烂电影的时代,9.6分的国产电影这是多么不容易的成绩啊;最近几天,笔者的朋友圈和微博都被《战狼2》刷了个遍,这让

2017-08-08 17:52:53 1152

原创 无监督对话数据清洗利器:Data Purification Framework

转载请注明出处:乐投网 - 无监督对话数据清洗利器:Data Purification Framework现在一提到聊天机器人,大家就会想起各种算法模型,端到端、生成式、深度增强学习。有一种给我足够多足够好的数据,我就能用算法突破图灵测试的风范。可恨的是,就是没够多够好的数据。相对于英文,中文可用的公开数据集少之又少。在聊天机器人里,可用的公开对话数据就更少了,比如闲聊类的也就小黄

2017-08-08 15:08:05 604

原创 一文带你读懂DeepMind新论文,关联推理为什么是智能最重要的特征

转载请注明出处:一文带你读懂DeepMind新论文,关联推理为什么是智能最重要的特征每一次DeepMind发布一篇新论文,媒体都会疯狂地报道。其中不乏许多让人迷惑的术语。比如就有未来主义者这样报道: DeepMind开发了一个可以感知周围事物的神经网络。 这不仅仅误导人,还吓跑了那些没有接受过博士阶段的学习的人。所以在这篇文章里,我打算用尽量简单的语言来解释

2017-08-08 15:06:11 370

原创 数据挖掘工程师入门资料

转载请注明出处:数据挖掘工程师入门资料今天我把数据挖掘入门资料整理了一下,希望能够对新人有帮助。一、python推荐粗读《Head First Python》一书,该书浅显易懂,有C语言基础的人只需一天就能读完,并能够使用python进行简单编程。“Head First”系列的数都很适合初学者,我还读过《Head First 设计模式》和《Head Fi

2017-08-02 14:26:37 866

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除