数据分析常用知识体系
【数据获取】
一、获取原始数据
1、从数据库 / 数据仓库中获取(数据库 + 数据仓库 + SQL提数)
2、爬虫爬取(R语言爬虫 + Python爬虫)
3、手工整理(问卷数据录入、数据表制作等)
二、获取整理好的数据
1、数据资源下载(统计局、经管之家等)
2、数据资源调取(R语言内置数据集、Python内置数据集)
【数据预处理】
一、数据库
1、常用数据库基础知识(Mysql、sqlServer、Oracle、Hbase + Hive)
2、SQL语句(数据查询select from、数据去重distinct、数据限制where、数据排序order by、数据顺序desc + asc、数据分组group by、数据过滤having、数据锁定limit、条件关联and + or + in / not in、通配符like + _、计算字段count + max + avg等、子查询、表联结inner join + left join + right join、插入数据insert into、创建表create、更新