![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据百问系列
to be a good girl
数据分析,SQL,机器学习
升级打怪
展开
-
数据百问系列之四:产品经理的能力期望
本次讨论的主题是:对于数据产品经理的突出能力,你更看重哪一方面?问题描述:现在有两个产品可能会和你合作:1、 一个产品,不懂技术细节,但是能给你带来业务价值,能帮你把数仓推广到全公司,帮你在老板前露脸2、另一个产品,对数仓很了解,甚至能帮你设计一套数据仓库,可能比你设计的还好,但是其他方面一般般,比较偏研发这两个产品,你会选哪个做你们的合作伙伴?请说出你的理由!分析:本话题是一...原创 2019-08-27 21:29:17 · 254 阅读 · 0 评论 -
数据百问系列之三:关于未知数据的处理
数据百问系列之三:关于未知数据的处理本次讨论的主题是:数据维度分类中,习惯将无法归类或者数据模糊的归为“未知”,那么对于这些未知数据, 我们应该怎么处理呢?问题:1、“未知”对数据分析和可视化有什么影响?好处和坏处是什么?2、需求方经常反馈看不懂“未知”数据,认为“未知”数据量级过大,你会怎么处理这种情况的?示例:比如每个城市的用户数北京 123上海 123……未知:23...原创 2019-08-27 21:34:19 · 705 阅读 · 0 评论 -
数据百问系列之五:什么是数据资产?
本次讨论的主题是:什么是数据资产?问题:大家所处的工作环境里面,有没有和数据资产相关的项目或者使用场景?分析:本话题是一个发散性的话题,并没有限制太多的内容,主要是想跟大家讨论一下关于“数据资产”这个话题,大家在都是怎么理解的。对于这个话题,我感觉需要拆开来看,首先需要先弄懂什么是数据?其次是弄懂什么是资产?最后再综合讨论一下什么是数据资产?关于数据:1、数据(data)...原创 2019-09-05 17:25:34 · 2006 阅读 · 0 评论 -
数据百问系列之二:游戏DAU骤降分析
游戏DAU骤降分析问题描述:假设你在一家游戏公司做数据分析,现在发现从8月份开始公司运营的某款游戏出现了DAU骤降的现象,你该如何分析这个现象?对于这个话题,我感觉可以从对内和对外两个方向进行分析,但是不管是哪一个方向,我觉得都应该先着手于最简单的方面去定位问题,所以下面的总结步骤中可能会有跳转的情况,因为我个人认为在数据分析过程中出现了问题是要对问题进行定位,定位到造成该问题的原因了,则需要...原创 2019-08-24 23:54:10 · 2768 阅读 · 0 评论 -
数据百问系列之一:你认为数据开发需要了解机器学习算法吗?
你认为数据开发需要了解机器学习算法吗?对于这个话题,我觉得了解机器学习算法还是很有必要的,不过有必要并不意味着就需要马上去学习。是否现在就要学习算法取决于你现在所处的状态及位置。刚入职不久的小萌新:如果你是刚入职场不久,那么我觉得此时掌握开发技术才是最重要的。在这个阶段,与其花费时间去了解机器学习,不如多花一点时间在打根基上。此时,多花点时间了解开发方面的知识、理解工作上的需求、掌握必要的开...原创 2019-08-24 23:50:32 · 222 阅读 · 0 评论 -
数据百问系列之六:数据仓库中的主题域是如何划分的?
本次讨论的主题是: 数据仓库中的主题域是如何划分的?问题:你在工作中和交流中,有主题域划分的例子可以分享吗?分析:本话题是一个发散性的话题,并没有限制太多的内容,主要是想跟大家讨论一下在工作和交流中大家都是怎么划分主题域的。对于这个话题,我觉得群友们的讨论已经很极致了,所以下面的文章中我就根据大家讨论的情况对这个话题进行一个整理与补充一点个人的理解(站在巨人们的肩上看问题~)关...原创 2019-09-18 23:09:56 · 11611 阅读 · 1 评论 -
数据百问系列之七: 在Hive中遇到了数据倾斜该如何处理?
本次讨论的主题是: 在Hive中遇到了数据倾斜该如何处理?问题:你在工作中有哪些小技巧或者套路来处理数据数据倾斜问题?分析:本话题是一个发散性的话题,并没有限制太多的内容,主要是想跟大家讨论一下当我们在工作中遇到数据倾斜的时候,大家都是怎么处理这一类问题的,有什么小技巧或者套路来处理这一块的问题?对于这个话题,我觉得群友们的讨论已经很极致了,所以下面的文章中我就根据大家讨论的情况...原创 2019-09-18 23:56:04 · 285 阅读 · 0 评论