- 博客(4)
- 收藏
- 关注
原创 电商数仓个人简总结
1.为什么做电商数仓 数据越来越多,我们把各部门的数据收集到一起,通过分析,计算等转化成对我们公司有价值的数据,为我们公司做决策提供一个数据支持.2.技术架构 日志数据:我们通过flume采集埋点的日志数据,然后拉取到kafka,再使用flume从kafka中拉取数据存到hdfs上....
2021-10-19 23:04:08 871
原创 scala读取txt文件实现WordCount
import scala.io.Sourceobject WordCount { def main(args: Array[String]): Unit = { //获取数据源对象 val source = Source.fromFile("D:\\yuhk\\a.txt") //一行行读取 val strings: Iterator[String] = source.getLines() //合并为一行字符串 val str: String =.
2021-10-19 14:53:36 856
原创 DataGrip2021.2安装
双击安装点击next选择安装路径,点击next安装选项,next点击install安装中选择立即重启,点击finish
2021-09-25 15:07:41 2489 1
原创 电商数据仓库
项目目的:做离线数据仓库,是为了协调公司的电商app,根据app得来的数据分析,分析数据,来明确公司下一步的发展方针,针对不同的用户群体来推出不同的产品,从而让公司有更好的营收;...
2021-09-08 10:43:45 131
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人