Power BI Desktop中支持python,在Power BI的数据获取、数据转换、数据可视化、数据输出的全流程中,都可以支持使用Python。关于如何全流程使用Python,可以参见文章https://blog.csdn.net/scut_yfli/article/details/104881688
本文先介绍如何在Power BI Desktop配置Python环境,及相关错误问题(坑点)的解决处理。
一、使用python
配置使用Python的原生环境作为主目录
二、使用Anaconda
配置使用Anaconda的环境作为主目录
三、简单导入数据测试是否正常运行
import pandas as pd
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age'],dtype=float)
print (df)
数据成功导入
四、相关出错问题解决办法
(1)无法连接,尝试连接时发生错误。详细信息:”ADO.NET:Python script error.
处理方法:首先在Power BI的选项功能中,核查“Python主目录”的设置,究竟是使用了什么设置。
如上图所示,如果Power BI中设置了Python主目录为Python原生安装目录。
因为本人日常是使用Anaconda的,在Python原生安装目录中,并没有安装pandas包。
在windows的命令行核实下,是否确实没有安装pandas,一般同样也会提示No module named ‘pandas’。在windows命令行使用pip install pandas命令安装pandas就可以解决了。
(2)无法连接,尝试连接时发生错误。详细信息:”ADO.NET:Python script error.importError:Missing required dependencies['numpy']。
从错误提示可以看到Power BI使用python时,会自动导入os,pandas,mataplolib几个包。如果这些包在python环境下没有安装就会出现问题。
同时如果这些包的前置包有问题,也会出错。如下图提示importError:Missing required dependencies['numpy']
处理方法:参考第(1)点处理方法,在python中安装相应的包即可解决。
(3)使用Anaconda环境出现错误。DataSource.Error: ADO.NET: Python script error.
D:\ProgramData\Anaconda3\lib\site-packages\numpy\__init__.py:140:
Original error was: DLL load failed: 找不到指定的模块。
根据使用习惯,我日常是在Power BI中配置Anaconda目录为python主目录。
但在运行时,出现了莫名错误。根据错误提示“Original error was: DLL load failed: 找不到指定的模块。”,判断也是导入前置包出现的问题。
此时到Anaconda安装目录,运行python.exe,输入命令import numpy,核查是否也同样错误提示。
如下图,发现也是同样错误提示。
处理方法:该错误是由于包路径混乱的问题,只要在windows的环境变量path中,添加Anaconda相关的目录,同时再重启一下Power BI软件即可解决。
D:\ProgramData\Anaconda3\Library\bin;
D:\ProgramData\Anaconda3;
D:\ProgramData\Anaconda3\Scripts;