数据库简单来讲就是一堆互相关联的数据,最基础的数据组成了表(table),也是我们经常看到的一张Excel的sheet。
Mysql的安装
- Mysql安装注意
首先去MySQL的官网下载,版本5.6以上即可,安装的过程不打算进行细说,谷歌有很多的教程。这里给大家分享下我踩过的坑。
刚开始大家把下载好的程序,直接一路选择默认。但是填写Root用户密码时,一定要牢记密码
剩下的照样可以一路选择默认。
- 安装GUI
在GUI界面上操作MySQL,Mac用户推荐SequealPro,Win用户推荐WorkBench,同样的是去MySQL的官网下载。
数据的导入
接下来所使用的数据是来秦路老师所提供,点击文末福利即可获得。
在数据的导入过程有几点需要留意下
-
尽量使系统的编码格式和文件的编码格式是相同的,比如说文件是utf-8格式,系统也要选择utf-8格式,否则数据中的中文将是乱码。
-
设置各字段的数据类型时,系统会帮我们自动选上,改不改都是可以的。int代表整数数值,varchar代表字符串(中文英文标点符号这类),括号里面的数字是允许存储字节,一般不需修改,但是对于某些数据字节较大的,相应的也要增大括号中的数字。
正式开始
对于数据的处理,从数据的筛选、数据分组聚合、时间类数据的处理,数据的清洗
- 先来看下我们的数据
SELECT * FROM data.analyst; #"*"代表的是所有的列
#data是数据库相当于一个excel文件,annlyst是数据表相当于sheet
其实这是一份各个城市的数据分析相关职位数据
- 根据判断条件查询数据
- 查询所有上海城市的职位数据
select * from data.analyst where city="上海"; #where 用于条件判断。
- 查询城市为上海,职位为数据分析师的数据
select * from data.analyst where city="上海" and positionName="数据分析师";
#使用and进行多条件查询
<