自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 AICUG人工智能技术沙龙

2019年03月24日 13:00 - 17:30 上海长宁区福泉路111号神州数码 本期由来自Intel、竹间智能、PinLan的老师为大家带来AI纯技术干货分享,现场参与讲师提问互动还可获得技术书籍和精美礼品哦! 关于AICUG AICUG(AI中国用户组)www.aicug.cn,致力于...

2019-03-12 14:17:45

阅读数 2744

评论数 0

原创 高并发应用中的数据库系统设计实践

本次分享高并发应用场景介绍,对数据库可能带来的压力,如何从内核、数据库架构方面解决高并发场景调度问题。同时介绍阿里云RDS PG相比社区版本有哪些优势,客户CASE 原文&地址https://www.slidestalk.com/s/aliyun_Des...

2019-02-28 17:05:12

阅读数 129

评论数 0

原创 大规模日志数据企业级分布式平台架构面临的问题与挑战

本次分享大规模日志数据企业级分布式平台架构面临的问题与挑战,架构之争和演进之路,当前架构的关键技术,未来架构优化思考。 原文&下载https://www.slidestalk.com/s/Enterprise_Distributed_Platform_A...

2019-02-28 17:02:57

阅读数 75

评论数 0

原创 Sizing the prize What’s the real value of AI for your business and how can you c

Artificial intelligence (AI) can transform the productivity and GDP potential of the global economy. Strategic investment in different types of AI te...

2019-02-28 17:00:39

阅读数 75

评论数 0

原创 强化学习在阿里的技术演讲与业务创新

当前的机器学习算法⼤致可以分为有监督的学习、⽆监督的学习和强化学习(Reinforcement Learning)等。强化学习和其他学习⽅法不同之处在于强化学习是智能系统从环境到⾏为映射的学习,以使奖励信号函数值最⼤。如果智能体的某个⾏为策略导致环境正的奖赏,那么智能体以后产⽣这个⾏为策略的趋势便...

2019-02-28 16:58:41

阅读数 252

评论数 0

原创 携程技术2018年度合辑

这本书作为 2018 年携程技术的结晶,集合来自携程技术中心微信公众号全年度的重要技术文章,涵盖了从无线大前端到后端架构,从大数据到 AI 应用,从研发质量到 DevOps 几乎所有主流的互联网技术方向。总共 69 篇,细分为 8 个领域:人工智能、架构、无线大前端、 大数据、质量、运维、数据库、...

2019-02-28 16:56:37

阅读数 109

评论数 0

原创 Kafka quick start

原文&地址https://www.slidestalk.com/s/Kafkaquickstart49206

2019-02-27 23:35:43

阅读数 25

评论数 0

原创 2019.02.23-中国银联-Apache Kylin 在中国银联的实践

讲师:王颖卓 中国银联 科技事业部高级主管 演讲概要:10年前,中国银联建成了统一的企业级数据仓库,确立了以 IBM Cognos 为核心的多维分析应用。经过10年的积累,IBM Cognos 在各个方面都迎来了巨大的挑战。经过选型验证,中国银联把以 Apache Kylin 为核心的 Kylig...

2019-02-26 22:21:56

阅读数 100

评论数 0

原创 2019.02.23-eBay-Apache Kylin Real-time Streaming

讲师:马刚 eBay 资深工程师 演讲概要: 为什么要做新的 Kylin streaming, 及其特点 新 Kylin Streaming 的总体架构及组件 HA 及列存储设计 消费及查询性能 原文&下载https://www.slidestalk....

2019-02-26 22:19:10

阅读数 70

评论数 0

原创 2019.02.23-携程-Apache Kylin 在携程大数据平台的优化及演进

讲师:张巍 携程 大数据资深研发工程师 演讲概要:本次分享将介绍携程在使用 Kylin 的过程中遇到的挑战和相关优化以及对于未来的展望。 原文&下载https://www.slidestalk.com/s/apache_kylin_ctrip_optim...

2019-02-26 22:17:01

阅读数 82

评论数 0

原创 2019.02.23-Kyligence-为 Apache Kylin 快速开发新数据源

讲师:李栋 Kyligence 技术合伙人兼生态合作技术总监 演讲概要:从v2.6.0版本开始,Apache Kylin 提供了一个Data Source SDK的功能,可以帮助开发者通过快速开发,实现Apache Kylin与新数据源的对接。通过JDBC接口,Apache Kylin可以从新数据...

2019-02-26 22:13:42

阅读数 96

评论数 0

原创 2018 HBase技术总结

HBase 是一个高性能,并且支持无限水平扩展的在线数据库,其存储计算分离的特性非常好地适应了目前的趋势,并且在国内大公司内都被广泛地应用,具有非常好的生态,是构建大数据系统的不二选择。 原文&下载https://www.slidestalk.com/s/...

2019-02-26 22:10:33

阅读数 111

评论数 0

原创 DH内存分析引擎

DH内存分析引擎专为高性能和大数据分析构建,比传统数据库 快 50x – 1000x。且基于工业化标准服务器,从TB 到 PB 快速扩展。 原文链接及下载https://www.slidestalk.com/s/DH97246 ...

2019-02-21 23:08:57

阅读数 55

评论数 0

原创 专注dApp高效执行和高并发的下一代公有链

Dora网络从三个方面来解决区块链目前性能不足的问题:纵向扩容,横向扩容和分层共识算法(DVBC),从而达到商业应用级别的TPS;并且兼容EVM,以便于现有dApp的快速移植。 原文&下载https://www.slidestalk.com/s/dora...

2019-01-28 18:48:06

阅读数 55

评论数 0

原创 数据仓库

数据仓库是一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。 集成:将多个分散的数据源统一成一致的、无歧义的数据格式后放置到数据仓库中,解决命名冲突、计量单位不一致等问题; 随时间变化:数据仓库中的数据反映了某一历史时间点的数据快照; 非易失:一旦进入数据仓库中,数...

2019-01-28 18:43:13

阅读数 35

评论数 0

原创 Go在区块链的发展和演进

Go语言发展至今已经过去十年多了,是目前最流行的新兴语言,云计算领域的首选语言,而且目前随着区块链的流行,Go再次成为了这个领域的第一语言,以太坊,IBM的fabric等重量级的区块链项目都是基于Go开发。 原文&下载https://www.slides...

2019-01-28 18:38:23

阅读数 108

评论数 0

原创 GraphLab: A New Framework For Parallel Machine Learning

原文&下载https://www.slidestalk.com/s/graphlab19587

2019-01-28 18:34:35

阅读数 62

评论数 0

原创 微软亚洲研究院27篇论文入选AAAI 2019

人工智能领域的国际顶级会议AAAI 2019将于1月27日至2月1日在美国夏威夷举行。根据已经公布的论文录取结果,今年的大会录取率创历史新低,投稿数量高达7745篇,录取的数量仅有16%左右。但在被录取的论文中,来自微软亚洲研究院的却有27篇之多,包括了机器学习、自然语言处理(NLP)、计算机视觉...

2019-01-28 18:30:27

阅读数 92

评论数 0

原创 Java开发手册

原文&下载https://www.slidestalk.com/s/Java21492

2019-01-25 18:17:16

阅读数 48

评论数 0

原创 Scala在互联网金融中的应用

原文&下载https://www.slidestalk.com/s/ScalaUSTC60

2019-01-25 18:13:18

阅读数 140

评论数 0

原创 邹丹_Flink在字节跳动的实践

原文&下载[https://www.slidestal

2019-01-25 18:07:34

阅读数 261

评论数 0

原创 Large-Scale Data Processing with MapReduce

介绍了MapReduce的诞生的背景,基本原理,算法思想,以及如何用于文本挖掘,管理关系型数据,如何进行图计算及常用图计算的实现伪代码(Dijkstra’s / BFS / PageRank),最后谈到了大数据之上的存储HDFS/HBASE以及Hive和Pig。虽然不是最新的流行趋势,但是已经把大...

2019-01-25 18:04:01

阅读数 41

评论数 0

原创 分布式计算平台介绍

分布式计算系统平台是将一系列用计算机网络相连接通信的,独立计算的模式和组件,集成到一个统一的平台,展现给用户的是一个完整的独立计算平台。本文介绍分布式计算平台的基本概念和不同计算模式,并对当前最为流行的Apache Spark / Hadoop原理做深入分享。 原文&a...

2019-01-25 17:59:33

阅读数 1035

评论数 0

原创 Kyligence公开课-Apache Superset设计与SQL查询

本次公开课邀请了 Kyligence 公司的 Python 全栈工程师赵勇杰为我们讲解Apache Superset。课程通过讲解 Superset 代码,使您可以快速了解 Superset 的系统设计,其中包含:Superset 系统架构、Superset 代码结构讲解、可视化查询到 SQL 生...

2019-01-24 19:03:38

阅读数 102

评论数 0

原创 Introduction to Spark

Spark’s goal was to generalize MapReduce to support new applications within the same engine Two additions: Fast data sharing General DAGs (directed a...

2019-01-24 19:00:23

阅读数 35

评论数 0

原创 大规模日志数据企业级分布式平台架构面临的问题与挑战

本次分享大规模日志数据企业级分布式平台架构面临的问题与挑战,架构之争和演进之路,当前架构的关键技术,未来架构优化思考。 原文&下载https://www.slidestalk.com/s/Enterprise_Distributed_Platform_A...

2019-01-24 18:56:30

阅读数 41

评论数 0

原创 A View of Cloud Computing

Our goal in this article is to reduce that confusion by clarifying terms, providing simple figures to quantify comparisons between of cloud and conve...

2019-01-24 18:49:52

阅读数 134

评论数 0

原创 How to Design a Good API and Why it Matters

为什么API设计很重要?API可能是一个公司/一个产品最重要的资产,你的客户可能会因为它好用,开始学习,付费购买并使用它们,并让客户们觉得离开你的API是需要付出巨大代价的,好的API设计会轻易俘获客户的心。当然API也可能会成为一个公司最大的债务,拙略的API设计可能会让你疲于应付你的用户支持。...

2019-01-24 18:46:41

阅读数 36

评论数 0

原创 ABRiS: Avro bridge for Apache Spark

ABRiS是来非洲的金融服务供应商,他们利用Apache Spark作为核心的数据处理引擎,本篇会讲解他们在Spark以及Spark生态中的工作贡献。 原文&下载https://www.slidestalk.com/s/abris_avro_bridge_...

2019-01-23 19:28:43

阅读数 39

评论数 0

原创 The Data Ecosystem 2.0

Alluxio创始人&CEO李浩源博士在2018 BDTC大会上的主题演讲。介绍大数据和AI时代计算存储架构的演进,以及Alluxio在生态系统中的位置。 想要了解更多Alluxio,访问官网alluxio.org 原文&下载https:/...

2019-01-23 19:26:09

阅读数 56

评论数 0

原创 Go在区块链的发展和演进

Go语言发展至今已经过去十年多了,是目前最流行的新兴语言,云计算领域的首选语言,而且目前随着区块链的流行,Go再次成为了这个领域的第一语言,以太坊,IBM的fabric等重量级的区块链项目都是基于Go开发。 原文&下载篇https://www.slides...

2019-01-23 19:23:11

阅读数 126

评论数 0

原创 桑文锋《数据化建设的时代机遇》

一家企业落地数据驱动包括三个层面:第一层是高层建立数据驱动意识; 第二层是公司的整体业务流程的改造,并将数据驱动引入;第三层是真正的落地层面。 原文&下载https://www.slidestalk.com/s/74258 ...

2019-01-23 19:17:40

阅读数 41

评论数 0

原创 Spark Structured Streaming

With the ubiquity of real-time data, organizations need streaming systems that are scalable, easy to use, and easy to integrate into business applica...

2019-01-23 19:15:19

阅读数 38

评论数 0

原创 小红书社区技术

本次分享,郭一主要介绍了小红书社区的数据技术。首先介绍了小红书的产品和社区个性化的推荐需要的关键技术。然后对社区的数据技术分别从接入层,业务层,数据服务层和数据仓库层进行了概述。然后讲述了一个利用流计算引擎Flink给线上推荐提供用户行为实时的多维度聚合的业务实例。最后对小红书下一年的数据架构发展...

2019-01-22 19:24:07

阅读数 625

评论数 0

原创 TiDB在小红书的实践案例分享

原文&下载https://www.slidestalk.com/s/TiDB_red

2019-01-22 19:22:02

阅读数 202

评论数 0

原创 PayPal merchant ecosystem using Apache Spark, Hive, Druid,

As one of the few closed-loop payment platforms, PayPal is uniquely positioned to provide merchants with insights aimed to identify opportunities to ...

2019-01-22 19:20:10

阅读数 27

评论数 0

原创 Vectorized Execution Explained

向量化是随着列存数据库一起成熟的新查询执行模型,诸如Hive,Vertica,Vectorwise,Clickhouse等都使用了该技术。向量化也是 TiDB 正在进行的优化之一。本次分享将从为何进行向量化,块执行,SIMD和晚期物化等多个方面阐述向量化引擎的设计和实现。 ...

2019-01-22 19:17:42

阅读数 45

评论数 0

原创 标签体系应用及设计思路

标签画像是精准营销、产品应用的中间层基础,可以实现的业务价值包含基于用户群体的生命周期管理、高价值客户深入开发、交叉营销,也可以输出用于个性化推送、个性化推荐以及个性化实时营销,同时也是数据分析和用户分析的属性源,具备非常强的应用价值。标签体系的建设,核心是从应用场景和商业目的出发,基于对业务形态...

2019-01-22 19:14:03

阅读数 1513

评论数 0

原创 【干货】数据库论文专题

今天分享一份关于数据库的论文资料专题,对数据库方面进行了很深的研究。此专题共71篇文档或论文,基本囊括了关于日常数据库搭建,维护,测试,优化,CPU,OLAP,并发分析与编译等方面的问题。 https://www.slidestalk.com/x/227/database/ ...

2019-01-21 19:26:12

阅读数 293

评论数 0

原创 企业级数据库POLARDB介绍&优化分享

PolarDB优化分享:PolarDB主要有五大核心优势: 兼容性 PolarDB兼容了当下最主流的、开发者最喜欢用的MySQL和PostgreSQL两种数据库生态,这意味着MySQL和PostgreSQL的老用户,在一行代码不用改的前提下,可以把业务从原来的开源数据库迁移到阿里云的企业数据库...

2019-01-21 19:19:41

阅读数 196

评论数 0

提示
确定要删除当前文章?
取消 删除