使用Spark Streaming SQL进行PV/UV统计
作者:关文选,花名云魄,阿里云E-MapReduce 高级开发工程师,专注于流式计算,Spark Contributor
1.背景介绍
PV/UV统计是流式分析一个常见的场景。通过PV可以对访问的网站做流量或热点分析,例如广告主可以通过PV值预估投放广告网页所带来的流量以及广告收入。另外一些场景...
文章
开源大数据EMR
2019-10-16
1504浏览量
使用Spark Streaming SQL进行PV/UV统计
1.背景介绍
PV/UV统计是流式分析一个常见的场景。通过PV可以对访问的网站做流量或热点分析,例如广告主可以通过PV值预估投放广告网页所带来的流量以及广告收入。另外一些场景需要对访问的用户作分析,比如分析用户的网页点击行为,此时就需要对UV做统计。使用Spark Streaming SQL,并结...
文章
light-rain
2019-10-15
3780浏览量
大数据全体系年终总结
到年底了,想着总结下所有知识点好了~今年应用的知识点还是很多的~
Hadoop生态圈:
1、文件存储当然是选择Hadoop的分布式文件系统HDFS,当然因为硬件的告诉发展,已经出现了内存分布式系统Tachyon,不论是Hadoop的MapReduce,Spark的内存计算、hive的...
文章
松伯
2016-12-11
1341浏览量
万券齐发助力企业上云,爆款产品低至2.2折起!
限量神券最高减1000,抢完即止!云服务器ECS新用户首购低至0.95折!
广告
看云栖说云栖—— 开源、SQL or NoSQL
查理·芒格:你必须知道重要学科的重要理论,并经常使用它们——要全部都用上,而不是只用几种。
本文内容提取自2019杭州云栖大会《开源数据库专场》、《NoSQL数据库专场》、《ElasticSearch开发者生态专场》。这次继续聊数据库,且还是聚焦于在线业务数据处理,但不像前几天在《双十一的俩功臣》...
文章
anxin
2019-12-08
193浏览量
云场景实践研究第20期:梨视频
更多云场景实践研究案例,点击这里:【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽
作为中国领先的资讯类短视频生产者,梨视频采用阿里云平台搭建了数据处理系统和梨视频推荐系统,本文从架构和实现的角度介绍梨视频上云的实践经验。
“Log Store是一站式日志收集服务系统...
文章
场景研读
2018-02-04
1661浏览量
大数据的分析工具有哪些?
大数据分析处理的工具大数据就是在各种类型的数据中快速获得有有效 有价值的信息的技术,大数据领域现今已经出现大量的 便于操作的新型技术,他们会是大数据采集,处理,存储和信息展现的最有效的工具。
1.大数据接入 大数据接入 已有数据接入,实时数据接入,消息记录数据接入,文件,文字,图片,视频等数据...
文章
游客3ddqk37qag4sa
2019-10-16
1059浏览量
专注年轻一代,基于E-MapReduce梨视频推荐系统
在2016杭州云栖大会的“开源大数据技术专场”上,梨视频大数据负责人杨智带来了《基于E-MapReduce梨视频推荐系统》的精彩分享。分享中,他重点介绍了梨视频中基于阿里云的数据处理系统和梨视频推荐系统,精彩不容错过。
以下内容根据演讲PPT及现场分享整理。
梨视频简介
梨视频是中国领先的资讯...
文章
云学习小组
2016-11-04
6192浏览量
Hbase在审计行业的应用
1、前言在技术快速发展的今天,各行各业的数据量不断增加。审计行业也发生了翻天覆地的变化,身处其中的毕马威,如何利用HBase提高对客户的服务,让客户的满意度有所提升。本文将从以下三个方面(选择HBase的原因,实例剖析,总结与展望)来分析。
2、选择HBase的原因
优化方式多对于一家大型企业来说...
文章
hbase小能手
2018-11-26
1481浏览量
全球首个OAM如何像智能机一样管理云端应用? | 开发者必读(084期)
最炫的技术新知、最热门的大咖公开课、最有趣的开发者活动、最实用的工具干货,就在《开发者必读》!
每日集成开发者社区精品内容,你身边的技术资讯管家。
每日头条
如何像智能机一样管理云端应用?全球首个应用管理模型开源
全球首个云原生应用标准定义与架构模型 Open Application Model...
文章
社区助手
2019-10-18
239浏览量
案例篇-HBase 在滴滴出行的应用场景和最佳实践
1.背景**1.1 对接业务类型**
HBase 是建立在 Hadoop 生态之上的 Database,源生对离线任务支持友好,又因为 LSM 树是一个优秀的高吞吐数据库结构,所以同时也对接了很多线上业务。 在线业务对访问延迟敏感,并且访问趋向于随机,如订单、客服轨迹查询。离线 业务通常是数仓的定...
文章
hbase小能手
2019-01-09
1647浏览量
如何基于 Flink 生成在线机器学习的样本?
作者:曹富强(微博)
在线机器学习与离线相比,在模型更新的时效性,模型的迭代周期,业务实验效果等方面有更好的表现。所以将机器学习从离线迁移到在线已经成为提升业务指标的一个有效的手段。
在线机器学习中,样本是关键的一环。本文将给大家详细的介绍微博是如何用 Flink 来实现在线样本生成的。
为何选择...
文章
阿里云实时计算Flink
2020-09-16
298浏览量
车纷享:基于阿里云HBase构建车联网平台实践
1.
业务介绍
车纷享是国内首家进行汽车共享开发和运营的公司。旗下共享汽车平台采用新能源汽车作为运营工具,以B2C+C2C汽车共享作为商业运营模式,采用车联网技术作为运营管理技术,目前已与国内多个城市建立合作。
公司打造会员制的分时自助租赁平台“车纷享”与“众车纷享”,以及纯电动新能源汽车分...
文章
桐碧2018
2018-03-23
13752浏览量
车纷享:基于阿里云HBase构建车联网平台实践
车纷享:基于阿里云HBase构建车联网平台实践
3天前1177
1. 业务介绍
车纷享是国内首家进行汽车共享开发和运营的公司。旗下共享汽车平台采用新能
源汽车作为运营工具,以B2C+C2C汽车共享作为商业运营模式,采用车联网技术
作为运营管理技术,目前已与国内多个城市建立合作。
公司打造会...
文章
姜炳
2018-03-26
2070浏览量
趣头条基于 Flink+ClickHouse 构建实时数据分析平台
作者:王金海@趣头条
摘要:本文由趣头条数据平台负责人王金海分享,主要介绍趣头条 Flink-to-Hive 小时级场景和 Flink-to-ClickHouse 秒级场景,内容分为以下四部分:
一、业务场景与现状分析
二、Flink-to-Hive 小时级场景
三、Flink-to-Click...
文章
阿里云实时计算Flink
2020-04-02
2174浏览量
云场景实践研究第11期:美柚
更多云场景实践研究案例,点击这里:【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽
在2013年美柚成立之初,架构采用自建机房的传统开发方式,当时托管机房内服务器数量达300台之多,在2014年美柚接触阿里云之后,逐渐采用阿里云的产品,从最开始接触公测的ADS到现在使...
文章
场景研读
2018-02-03
2010浏览量
典型技术架构的分析和构建——《企业大数据实践路线》之四
作者:阿里云MVP戚俊
本文系《MVP时间》视频课程《4节课看懂企业大数据实践路线》的文字版,视频请看MVP时间课程主页
视频课程直达
上期内容回顾解析业务数据的特征——《企业大数据实践路线》之三大数据在媒体行业的应用——《企业大数据实践路线》之二
今天我们主要来说一下典型技术架构的分析和构建。这...
文章
MVP时间辰悠
2019-01-13
2784浏览量
美柚:最懂女性App背后的混合云架构与大数据服务
免费开通大数据服务:https://www.aliyun.com/product/odps
直播视频:
(点击图片查看视频)
幻灯片下载地址:https://oss.aliyuncs.com/yqfiles/5b0a3ac1717e9f25bfd528e1abb60f9c.pdf
3月...
文章
场景研读
2016-03-28
20982浏览量
云原生应用和容器设计模式的综述和展望
2016-12-12 作者:王昕 来源:InfoQ
信息系统的分层
我们平常所使用的所有应用软件,如果从根本上看,都可以看作一种信息处理系统。人们跟这些系统的关系,无非是人输入信息处理的请求意图,经过信息处理系统的处理,系统返回一个输出结果给人。如果只考虑一个系统的使用者,似乎对系统的输入者...
文章
【云行】
2016-12-13
2395浏览量
1269道Java技术答疑,阿里技术专家帮你Java技术进阶
云栖社区邀请到6位Java技术专家帮开发者答疑解惑,其中精华的1269道问答已经整理出来,供大家学习!
如有Java相关问题,请向专家提问https://yq.aliyun.com/promotion/755 ,或者在云栖社区Java问答界面提问https://yq.aliyun.com/tags...
文章
管理贝贝
2018-11-22
4155浏览量