Altair Monarch 迎来30周年,推出2020版本
2020年6月15日,Altair宣布发布新版 Altair® Monarch®,此版本是Altair强大而直观的数据准备解决方案的重要更新之一。
为了庆祝Monarch软件产品发布30周年,新版本增强了从Excel电子表格、PDF和基于文本的文件等数据源中自动提取和转换数据的能力。
使用Monarch进行快速、准确的数据准备,有助于用户进行有效的数据分析和机器学习预测。
Monarch 2020 新功能一览:
- Excel 数据提取——这一独特功能允许用户处理复杂的Excel输入。现在可以使用规则从用于报告或多个合并工作表的工作簿中提取数据和元数据的结构并将其添加到其中;
- PDF提取改进——通过识别渲染过的PDF页面图像上的矩形和线条等图形元素,Monarch可以从各种报告样式中成功提取任何背景颜色上的文字;
- 支持Altair Units——Altair灵活的软件许可模式允许客户只在需要的时间购买所需的产品。
Altair® Monarch® 适用人群:
数据工程师、数据架构师、数据科学家、商业分析师、会计师、审计人员以及其他任何需要将原始和混乱的数据转换为安全的、可信的、准确的以及专业整理数据集的人员都可以使用Monarch。数据工程师、数据架构师、数据科学家、商业分析师、会计师、审计人员以及其他任何需要将原始和混乱的数据转换为安全的、可信的、准确的以及专业整理数据集的人员都可以使用Monarch。
Monarch还可以用于任何需要连接到不同数据源、完成数据准备和数据转换任务的垂直行业。例如,专注于策略、计划和分析的用户创建Monarch模型用于生成合规报告、账目核对报告、统计相关报告或许多其他使用案例的报告。这些数据集也可以用来建立机器学习进行预测。
Altair首席技术官Sam Mahalingam表示:“凭借数以万计的全球用户,Monarch在帮助客户克服复杂的数据准备挑战方面已拥有长期且大量经验。自最初发布以来已有30年了,我们现在提供更大的自由度,将数据从多个来源转换为强大的业务资产。 ”
新功能详细应用
工作表设计(Excel 数据提取)
用户可以轻松、快速地从包含多个选项卡(工作表)、合并的单元格、专用的大小写、使用条件格式(颜色)的行/单元格/列等的电子表格中提取数据。
Monarch 2020提供了引导页来帮助新用户轻松提取数据和了解Excel数据提取
可以在Monarch 2020中导入以XLSB (Excel二进制工作簿)格式保存的Excel文件
可以在Monarch 2020中导入有密码保护的Excel文件
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210527095729746.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2FsdGFsYQ==,size_16,color_FFFFFF,t_70)
在定义数据提取时,Monarch会同时捕获单元数据和元数据,引导页增强了用户体验
PDF提取改进
增强了对齐网格的能力。Monarch可以处理文本布局不是最佳格式的PDF文件。例如,PDF文件中的数据行可能使用单行、多行或在单元格中对齐居中。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210527095847731.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2FsdGFsYQ==,size_16,color_FFFFFF,t_70)
在单元格中将文本包装成多行数据的例子,
更容易提取额外的文本行
![在这里插入图片描述](https://img-blog.csdnimg.cn/2021052709591452.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2FsdGFsYQ==,size_16,color_FFFFFF,t_70)
中心对齐的例子,单元格中心有时是一个逗号,有时是一个数字。当建立数据提取时,Monarch克服了更多字段不一致的情况
使用新版本 PDF 输入引擎,用户可以从PDF文件中抓取数据到左侧,确保对齐正确。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210527100013154.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2FsdGFsYQ==,size_16,color_FFFFFF,t_70)
原始PDF文件中的数据居中对齐,没有跨行对齐。如图所示,数据可能会在PDF数据提取中丢失。
Monarch 2020中新的文本对齐功能可以更好地将数据行和列对齐,以确保所有数据都包含在完成的提取中。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210527100050207.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2FsdGFsYQ==,size_16,color_FFFFFF,t_70)
Monarch 2020中新的文本对齐功能可以更好地将数据行和列对齐,以确保所有数据都包含在完成的提取中
模式更改解决方案 (映射列)
在早期版本的 Monarch Data Prep Studio中,源文件中列名的更改会中断 Monarch 工作区的流程,需要用户手动更新和纠正。
Monarch 2020 可以灵活地检测模式更改和映射列,这样源数据中对列名的更改就会在工作区中自动更新,可维护性增强,保障工作流更具可重复性。
其他亮点
焕新品牌及主题——通过解决方案的主界面与整个Knowledge Works平台相关联,同时突出了我们的预测分析/机器学习和可视化工具
用户体验增强
可重复使用性的改善:快速且轻松地从其他工作空间中导入表格
设计的改进:连接、数据映射和工作流等任务现在比以往更便捷也更强大
支持Altair Units——改进了Monarch使用单位许可技术的方式
您可以点击下方链接访问官网了解更多信息并申请免费试用:
https://www.altair.com.cn/monarch/
.
Altair Knowledge Works™产品
Altair Knowledge Hub™:基于网页的数据准备,用于访问、清理和格式化几乎任何来源的数据。协作环境允许多人从事数据准备任务并共享完成的数据集,而不会影响数据沿袭、数据治理和数据安全性
Altair® Knowledge Studio®:为数据科学家和商业分析师设计的一个开放、灵活的预测分析和机器学习平台。其行业领先的可视化分析建模方法使数据科学团队能够创建高质量的机器学习/ AI模型
Altair Panopticon™:提供内嵌的工作流可视化和领先的流数据分析