SQL server 2016 中的 Microsoft R 服务简介
Tomaž Kaštrun, 2018/09/14 (首次出版: 2016/09/15)
R 是一种统计编程语言, 主要用于统计计算和分析, 数据挖掘和机器学习, 它是一个非常强大的工具, 图形和数据可视化。它是一个自由的软件环境, 是跨平台 (UNIX、Windows、MacOS), 大部分的库和包开发都是由社区努力推动的。
通过 SQL Server 2016 中提供的 r 服务, Microsoft 正在使 R 语言可用于更灵活的数据分析, 使共享数据洞察更加容易, 并克服内存 (RAM) 限制。这意味着 R 与 SQL Server 的集成使得对更大的数据集、实时 OLTP 分析和任何类型的大型资料分析 (如 Hadoop、Teradata 等文档系统) 的分析比以往任何时候都容易得多。
R 集成
在 SQL Server R 集成之前, 许多用户以及许多组织在克服成功数据分析的障碍方面遇到了不同的挑战。 微软已经强调并克服了一些主要问题。随着 R 集成到 SQL Server 环境中, 数据科学的知识现在可以在从数据科学家到数据工程师和数据管理员的移动中更容易和更快地共享。这种卸载此项工作的能力也代表了生产率的提高, 因为数据科学家现在可以专注于核心分析, 缩短部署预测模型的时间, 并促进实时分析。
现有的基础结构 (SQL Server 数据库、角色、访问、安全性) 也有助于实施结果, 因为 SQL Server 中的 R 是构建在企业规模上的, 可以处理大量数据。使用 R 将会超出一个小的数据库, 并有助于使数据在云中和内部的数据更紧密地结合在一起。 最后, 此 R 环境是为了更快、更好地响应更改而构建的 (在更快地准备新数据模型、部署和利用机器学习算法方面)。
产品家族
革命分析是微软在2015年4月获得的。随着这一收购, R 引擎的两个版本一起来: 革命 R 开放为社区和革命 R 企业为商业目的。
收购后, 微软保持了革命的开放几乎相同, 它成为微软 R 开放。革命 R 企业成为了 SQL 服务器 R 服务 (这是微软 r 服务器的数据库版本在 SQL 服务器上的 Windows 操作系统) 和微软 R 服务器;二个产品, 在革命 R 企业中已经是可利用的。微软 R 服务器 (也称为微软 R 服务器独立) 主要是为 linux (红帽或 SUSE linux 发行) 在 Hadoop 或 Teradata 系统上支持连接到 Azure 云。