本人于明年毕业于英国诺丁汉大学的商业数据分析专业,目前在一家CRM公司的数据分析岗位实习。在这我愿意分享和总结我的学习和工作经历,帮助有意愿从事这一行业的同学在数据分析的道路上少走弯路~ (我会发布系统的从零数据分析学习系列,SQL和PYTHON,并会结合自己工作的内容和心得来阐述概念)
数据
关于数据本身
数据在我们生活中无处不在,比如说零售超市的交易订单,浏览网页的追踪数据,社交软件的数据等等。举个栗子,乐高玩具想必大家都熟悉,乐高模型是由一片一片的乐高块组成的,我们可以把乐高块组合成任意我们想要的模型,我们仅仅需要知道哪些乐高块是有用的以及乐高块的组装说明。乐高块就是我们的日常数据,乐高模型就是我们最后的数据结论(报表)。那为什么不直接存储好组装好的乐高模型呢,因为数据经常会更新,而且有时候需要新的乐高模型,拆掉乐高模型再组成新的模型则需要很高的成本。所以通常的情况下,我们直接存储乐高块就够了~ 数据具有两面性:正确或者错误。比如说今天的猪肉价格是20元/斤,今天的黄金价格是1900美元/克,好处就是只具有两面性的事物方便判断和运算,而运算是我们可以通过代码来实现。
工作心得:由于我是在CRM公司的数据分析人员,所以我平时会接触到大量的数据,无论是源数据(品牌商每天会传输他们的原始客户数据到我们数据库,比如Fresh各个产品线的线上线下的订单数,天猫和线下客流量数等等)还是我们整理好的数据(经过数据清理和指标输出)。
数据分析岗会强调数据敏感性,那么我认为培养数据的敏感性首先需要大量的‘吸收’数量,比如说你要先了解之前Fresh在前两年每个月的客单价,那么你才能很快反应出这个月客单价是否有大波动(没错,就是靠记忆数据)。除了‘背’数据外,你也需要什么是客单价指标,指标背后的意义。
数据库
储存数据的地方叫做数据库,数据库又分为关系型数据库和非关系型数据库。在数据分析过程中,主要使用的是关系型数据库,比如说Oracle和SQL。非关系型数据库在这里先不讨论。什么是关系型数据库呢?简单来说就是二维图表组成的数据库,一行就是一个数据记录,每列则代表数据的属性。下面这个链接是某知乎大佬对于关系型数据库通俗易懂的讲解。
对于关系型数据库,我举个栗子。我获得了一个数据集:今天的猪肉价格是20/斤和今天的黄金是1900元/克。
在今天的工作中我想知道猪肉的相关信息,那么我就可以直接输入SQL代码:
select * from table
where item = ‘猪肉’
那么和猪肉相关的信息则会马上出现,和猪肉无关的信息则不会呈现。因此输出的结果为:
这就是我对关系型数据库的理解。
工作心得:在工作中我们公司使用的数据库是SQL Sever,可能其他公司会使用不同的SQL,比如说mysql,postgresql,但是这都是关系型数据库,原理也是大相径庭的。
以上就是本文的所有内容,特别感谢我的家人朋友对本文提供的建议,如果看过的各位觉得有帮助的话,可以点赞收藏,欢迎一起讨论和提出疑问,在数据分析的路上一同进步。感兴趣的朋友还可以看我之前第一期内容和关注我的知乎:数据分析宇酱
从零开始数据分析1