如何成为python数据分析师
1:excel 数据分析
最基本的数据分析 收集 和运用 最常用的工具
熟练 然后 对付绝大部分的工作
2:SQL (structured query language)数据库语言
要会在数据库里增删存取数据,大型数据分析必备技能
效率大大的提高
sudo service mysql start
mysql -u root
主要的语法和逻辑 类似 `
create / use / create table / insert into /
show tables /select * from / where / and-or /in- not in/ like /max-min
/group by /order by/ count /sum /if /join /limit ..........
除此之外:
-
SQL被作为关系型数据库管理系统的标准语言。SQL Server是由Microsoft开发和推广的关系数据库管理系统(RDBMS)
-
MySQL是轻量型数据库,并且免费,没有服务恢复数据。
-
Oracle是重量型数据库,收费,Oracle公司对Oracle数据库有任何服务。
-
DB2 是美国IBM公司开发的一套关系型数据库管理系统
-
Microsoft Office Access是由微软发布的关系数据库管理系统。它结合了 MicrosoftJet Database
Engine 和 图形用户界面两项特点,是 Microsoft Office 的系统程序之一
3:数据可视化
数据分析是用来监控数据和观察数据
兜售自己的观点结论并且做报表给老板看
所以要学会 tableau 和 finebi
4:数理统计学
需要从基础的统计知识(描述性统计,区间估计,假设检验)出发到基本的统计知识(T检验,方差分析)最后到商业常用的模型(回归分析,方差分析),学习数据分析背后的逻辑,掌握用统计学的概念和思维去思考。
然后竟然会使用spss sas 简单操作
5:数据挖掘
数据挖掘(Data Mining)的定义是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。
数据挖掘能做以下七种不同事情:
· 分类 (Classification)
· 估计(Estimation)
· 预测(Prediction)
· 相关性分组或关联规则(Affinity grouping or association rules)
· 聚类(Clustering)
· 描述和可视化(Description and Visualization)
· 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
目前,以上。