rmd 支持调用多种编程语言,使用 reticulate 包可以让 r 与 py 相互交互。
在 rmd 中的 setup
块加入以下命令,来使用本地安装的 py3。例如:注意以下代码块复制粘贴后要去掉 `
前的 "
(代码块显示 `
有些麻烦)
"```{r setup, include=FALSE}
# 使用 python
library(reticulate)
use_python("/usr/bin/python3")
"```
使用 r 命令 py_config()
显示 r 识别的py环境
"```{r}
py_config()
"```
在 运行 python 的地方写 py 代码:
"```{python}
import pandas
flights = pandas.read_csv(
"https://raw.githubusercontent.com/mwaskom/seaborn-data/master/flights.csv"
)
flights = flights.dropna()
"```
在 调用 python 变量的地方用 py$变量名
,r 针对 numpy 和 pandas 数据类型做了识别和优化:
"```{r,fig.width=7,fig.height=3}
library(ggplot2)
ggplot(py$flights, aes(year, passengers)) + geom_point() + geom_jitter()
"```
其他:
- 如果没有指定本地的 py,而且使用 r 命令
Sys.which("python")
是空串,那么reticulate
会提示下载安装 miniconda。所以本地安装了 py 的话就指定一下。 - python 也可以使用 r 的变量,例如 r 的内置数据集
cars
可以被 py 块用r.cars
调用,且数据框可以自动转化 - 更多细节内容参考:https://rstudio.github.io/reticulate
- 不是很建议 r 与 py 在一个脚本中互用。大部分情况应该是在一个编程语言中处理数据,把结果输出再放到另一个语言继续处理;或者完全用一个语言处理数据更直接。
- 以下为完整例子
Rmd 输入内容:
PDF 输出结果: