![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
当厨子的程序员
我有一个梦想,当一个厨子
展开
-
数据预测——用户流失收入预测思路与实操
这是一次个人实际工作内容的复盘,从开头到结尾,尽量记录得通俗易懂。原创 2020-10-11 09:18:57 · 818 阅读 · 0 评论 -
数据支撑人员与营销人员沟通--“拉稀式”的数据需求
今天收到一个数据需求,是在之前的需求上的叠加,内容是在某张报表中增加几个字段,这已经是第三次需求叠加,每次在原有基础上增加几个字段,忍不住爆了粗。为什么不能够一次性构思出需要的字段避免来回折腾修改?提出这种“拉稀式”的数据需求呢? 作为营销岗转数据岗的人,曾经我也是提出需求的人,我一般会根据分析需求列出自己需要的字段信息,并在非通用字段的后面附加详细的口径说明,力求数据支撑人员一看就懂,减少来回沟通的时间成本、人情成本。我认为这是一个很好的习惯,帮助我实现数据需求的支撑人员也十分认同我的方式,对我有着良原创 2020-09-22 21:48:30 · 133 阅读 · 0 评论 -
Hadoop Hive使用有感
Hadoop hive适用于处理大数据量运算,对于简单的数据运算也可以支持,但是其启动开销时间十分漫长,导致一个简单运算也需要耗费相当长的时间。近期在做数据预测相关的工作,需要使用SQL语句对模型进行快速的数据校验,在Hive运行简单的SQL语句真是令人抓狂,每一段代码都需要等待很长的运行时间,工作效率变得十分低下,令人十分烦躁。如果可以,简单的SQL运算还是使用Oracle、MySQL 这些标准数据库(不知道这么称呼对不对),后台机制经过优化的运行效率会高很多。...原创 2020-09-19 16:49:23 · 221 阅读 · 1 评论