![40a20ce2be60d007755e66fc99d8d828.png](https://img-blog.csdnimg.cn/img_convert/40a20ce2be60d007755e66fc99d8d828.png)
领域:零售,电子商务,旅游,酒店,物流和制造业
商业分析师必备的技能:
理解商业和商业问题
可应用于商业数据的数据分析技术和算法
计算机编程
数据结构和数据存储或数据仓库技术,包括如何有效地查询数据
数据分析中使用的统计和数学概念(朴素贝叶斯算法,回归,矩阵代数和成本优化算法,梯度下降或上升算法)
从商业问题开始,所有数据视为和商业问题相关/从数据开始,了解从数据红观察到的模式和解读到的信息-研究数据,删除已丢失数据元素或数据错误-检查数据中的异常值,清除异常值,降低对分析的不利影响-确定要使用的数据分析技术(监督或无监督方法)-分析结果,检查有无其他可替代技术,以获得可能的更好结果-验证结果后,解释结果-发布结果,学习和模型-应用从结果模型获得的只是-使用学习,模型不断进行校正
商业分析框架:
推理统计:
中心极限定理,t检验,假设检验,卡方检验,F检验(SPSS,Strata)
知识发现:
机器学习,数据挖掘,web挖掘,预测分析(R,Spark,SAS)
报告:
执行信息,系统,决策支持,仪表板和积分卡,数据可视化(MS Excel,Tableau,SM BI)
数据仓库:
关系数据库/NoSQL数据库/数据集市/元数据
商业分析和统计工具:
Excel:描述性统计,F检验,卡方检验,t检验,方差分析(ANOVA),条形图,饼图,线性回归
Gretl(开源软件):回归和时间序列分析,最小二乘法,极大似然,GMM,单方程和系统方法,时间序列方法:ARIMA,各种各样的单变量模型
Octave(开源):概率分布,描述性统计学,假设检验,t检验,方差分析,绘图,直方图,聚类分析
MATLAB:全套统计和机器学习功能,非线性优化,系统识别和财务模型,Hadhoop中的MapReduce功能,并通过接口与ODBC/JDBC数据库连接
PSPP:开源软件,比较方法,线性回归,逻辑回归,信度分析(克朗巴哈系数,非失效分析或韦伯分布),数据重新排序,非参数检验,因子分析,聚类分析,主成分分析,卡方分析
OpenStat:包含大量各种各样的参数,非参数,多变量,度量,统计过程控制,财务以及其他算法
Salsat:开源软件,描述性统计,推论统计,参数和非参数分析,条形图,箱线图,直方图等
IBM SPSS:全套统计分析,参数非参数分析,分类,回归,聚类分析,条形图,直方图,箱线图,社交媒体分析,文本分析等
Stata:描述性统计,ARIMA,方差分析和多元方差分析,线性回归,时间序列平滑,广义线性模型(GLM),聚类分析
Statistica:统计分析,图表,绘图,数据挖掘,数据可视化
sciPY:优化,线性代数,插值,数字信号和图像处理和机器学习技术
Weka:包含一系列可视化工具,用于数据分析的算法和预测建模,具有图形用户界面
RapidMiner:机器学习环境搭建,数据挖掘,文本挖掘,预测分析和商业分析
R:支持统计分析,直方图,箱线图,假设检验,推理统计,t检验,方差分析,机器学习,聚类等全套功能
Minitab:描述性统计分析,假设检验,数据可视化,t检验,方差分析,回归分析,信度分析,生存分析
Tableau Desktop:数据的统计摘要,趋势分析实验,回归和相关性,直接把数据仓库和现场最新的数据分析进行连接
TIBCO Spotfire:统计和完整预测分析。把R,S+,SAS和matlab集成在一起,以及定制应用程序
SAS:高级统计和机器学习等功能