powerbi集成python缺点_为什么 powerBI 那么方便还没有被普及啊?

Power BI是从2017年才开始发布的,以企业自主式BI为切入点进行市场推广,当目前来说推广效果不是太好,因为易用性不是太高,如一些复杂的KPI就需要DAX去编写,而这个语言不同于SQL,是需要学习时间。

想要用好Power BI,就不得不提微软BI产品线(全家桶):

一、 SSIS:Microsfot Intergration Service的简称,用来处理ETL任务,可以实现各种数据的集成,如从文本文件、Oracle、SAP系统、My SQL、Sharepoint等集成数据。可以执行自家的C#代码、Python代码等进行深度整合数据。

二、 SSAS:SQL Server Analysis Services的简称,可以创建Tabular模型(表格模型)和Multi Dimensional 模型(多维模型)。

Tabular模型主要用DAX编写KPI;Multi Dimensional 模型用MDX进行编写KPI,另外多维模型支持自定义的权限控制(可以嵌入C#编译好的DLL来进行数据权限深度定制),而Tabular模型是不支持的。Multi Dimension 模型支持一些常用的机器学习算法,如KNN,K-means,时间序算法,神经网络等,该模块被方在Multi Dimension的Data Mining模块,而Tabular模型是不支持机器学习的。

SSAS创建出来的模型又称Cube,主要是给Power BI提供数据,有了改模型的支持,业务人员就可以真正的实现自主式BI了,只需拖拉指标就可以实现报表的呈现。

三、数据仓库:说了ETL和数据集市,就不得不提数据仓库。数据仓库建模方式比较多,业界常用三种建模方式:1、Kimbal模型 2、3NF模型 3、DataVault模型

Kimbal模型:典型的数据仓库建模模型,又称维度-事实建模模型或星型模型。改模型分为维度表、事实表。维度表中的主键采用代理主键,配合业务主键共同组合成了维度表的数据,业务主键是可以有多个(这个是因为数据可能来源于多个业务系统,业务键不统一),有的维度表还需要实现缓慢变换,这也是Kimbal模型的特点。事实表主要存放指标数据和维表的代理主键。优点是:数据可溯源 缺点是:模型在数据上维护困难,如果维度数据有问题可能造成灾难性的后果(重跑维度数据生成新的代理键,然后跑事实表引用新生成的代理键,如果数据量大的话。。。千万要顶住压力)

3NF模型:满足数据库3范式的建模方式。优点:建模简单、易扩展,维护简单 缺点:无法实现数据的溯源(因为维度没有设计代理键,数据一般是直接覆盖,所以无法溯源)

DataVault模型:又称星链模型,结合了Kimbal的优点和3NF的优点的。需要了解详细情况的小伙伴可以自行查找相关资料

四、 机器学习、深度学习:从SQL Server2016开始,微软在SQL Server里集成了机器学习。SQL Server2016只支持R语言进行开发机器学习的东西,从SQL Server 2017开始支持Python,目前最新的SQL Server版本是2019.在安装Pyhon机器学习时会自动把Anaconda库给安装好,安装好后启用机器学习脚本就可以执行sp_execute_external_script来使用Python编写机器学习算法,实现如KNN、NaiveBayes、时间序列算法等。如果需要安装Tensorflow等库需要使用sqlmlutils来进行安装,安装过程。。。,建议还是在外部执行Python,把结果更新进数据更好,因为之前折腾2天硬是没安装成功,除非独立的包,总的来说SQL Server机器学习安装包的过程真的痛苦,该死的sqlmlutils。

以上是微软本地版本的BI实现方案,微软还提供了Azure版本,感兴趣的小伙伴可以自行查找相关资料。

报表方面还有SSRS、PerformancePoint(已经淘汰了)。

另外,微软的BI真的不好找工作。。。入行需谨慎。

如果是做数据分析Power BI、SPSS、SAS、EXCEL到是不错的组合。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值