数据产品经理要做数据分析,首先要学如何获取数据。有些人说,我请开发小伙伴导数据不行吗?一方面工作中,获取数据是一个比较频繁的事情,你经常麻烦同事帮忙取数据不现实;另一方面生产环境的数据也是非常敏感的,不可能随便导出使用。
![9612df64572f740a88e220cfa9541acc.png](https://i-blog.csdnimg.cn/blog_migrate/00e9032d110ab8ee2cf57b450d5cfcf3.jpeg)
基础概念
我们一般使用什么工具查询数据呢?就是用SQL语言从数据库查询数据。
什么是SQL?
操作数据库里数据的一种结构化开发语言。
什么是数据库,什么是表?
你可以把数据库想象成一个储存文件的“书柜”;书柜里面的一本本书就是数据库里的“表”;书里面印刷的字就是“表”里面的“数据”。
数据库有很多种类型,一般来说用的比较多的是关系数据库。顾名思义:关系数据库=多张表+各表之间的关系。
表的一般结构是什么样的?
数据库里面的“表”和Excel里面的表是一样的。一般包括三个部分:表的名称,表的列,和记录数据的行。如下图:
![43179c45df15e3dd46e2d31aac807fcb.png](https://i-blog.csdnimg.cn/blog_migrate/bc2390ca154aa2e359efb12eaa47ced9.jpeg)
蓝色背景的是表的名称(这个不在表的内容里面,为了展示方便,我写在了表里面)。
绿色部分是表列名。
白色部分是记录数据的行。
表与表之间如何建立起关系?
通常一个关系数据库里面会有很多张表,不同的表之间通过什么建立关系呢?下面列了一个数据库的两张表:左边是出版商表,右边是财经书籍表:
![163df8c5af55e61ecbc76c91b2d16f39.png](https://i-blog.csdnimg.cn/blog_migrate/44d3c523d1cf6aa6b1aa0b8e24c239dd.jpeg)
出版商表的灰色部分是中信出版商的基本信息,财经书籍表的灰色部分是中信出版商出版的书籍信息,我们就可以认为这两张表的灰色部分都会通过“出版商编号”关联起来了。(为什么不是出版商名称?因为名字可能会重复,但是编号一般是去重的)。出版商编号也叫做出版商表里的"主键"。
因此,表和表之间一般都是通过主键关联起来。
表和表之间有关系也就是表之间的数据能够通过主键匹配起来。
如何安装数据库?
数据库软件是用来存放数据的工具,市面上有很多种,如MySQL、Oracle、Microsoft SQL Service。我们这里主要介绍MySQL。
使用MySQL数据库,一般要安装两个软件:
- MySQL:这是一个关系型数据库管理软件。下载地址:https://dev.mysql.com/downloads/(先安装这个)
- 访问数据库的图形化工具:这个有很多软件,Introduction、Dbeaver、Navicat等等。我一般用Navicat(要付费购买,可免费试用。)下载地址:https://www.navicat.com.cn/products
安装步骤:
我的电脑是mac,我介绍下mac的安装方法,windows大同小异:
1 .MYSQL的安装,一路默认安装,中间有一步需要设置密码,这个密码一定要记住,后面连接数据库的时候要使用:
![e8df1fa7acdbac7acf0a2e84db07ee27.png](https://i-blog.csdnimg.cn/blog_migrate/5673363c481ba85abb03fd3da5d29f5c.jpeg)
2 .安装完成后,打开系统偏好设置,验证是否安装成功。(有下图的小海豚就成功了)
![1d61b65317d160d0b28b756f3e7cd11f.png](https://i-blog.csdnimg.cn/blog_migrate/4819dd59dfd4e20aeba2a0eadd5426e5.jpeg)
3 .安装Navicat,下载后按照默认路径安装直至完成就可以。
4 .Navicat连接数据库:打开左上角的【连接】,选择【mysql】,弹出如下窗口:
![41c1209b3f02e8a62b456033825272e0.png](https://i-blog.csdnimg.cn/blog_migrate/3b6767ccd592d850e3ef76fe9355bcf9.jpeg)
连接名:自己随便起一个名字。
添加到、主机、端口、用户名:都不用修改,默认的值就可以。
密码:输入刚才第一步设置的密码。
以上内容都输入完后,点左下角的【连接测试】。连接成功,则表明连接成功。
5 .验证连接成功,连接成功后,软件左边就出现连接的数据库。接下来就可以在数据库里面新建、删除表,插入,更新数据等操作。
![f592df2bb3c975e02ebea481a3c35d85.png](https://i-blog.csdnimg.cn/blog_migrate/dff17eb54d7da41ad0ae3b33161db9c6.jpeg)
数据获取的基本工具已经准备妥当,接下来会讲一下SQL基本语法,简单查询,复杂查询,多表查询,汇总分析等。
欢迎持续关注