本章介绍如何比较并选择最优模型;如何管理模型安全;如何在SSRS中使用模型。
学习目标:
l 使用DMX查询数据挖掘模型
Ø 使用SSRS报表查询模型
Ø 使用预测查询建立程序建立DMX
Ø 使用SSMS建立DMX
l 使用挖掘准备性图表测试数据挖掘模型
Ø 复审分类矩阵
Ø 复审梯形图
l 实现数据挖掘安全
Ø 赋予访问数据挖掘结构的权限
Ø 赋予访问数据挖掘模型的权限
一、测试模型的准确性
1、预测模型准备性
通过在准备数据时将数据分隔为训练集和测试集,训练模型使用训练集,而评价模型使用测试集。有三种标准的显示预测质量的方法:lift chart, profit char, classification matrix.
1)梯形图和利润图
很简单地显示出各种模型间的性能差别。
梯形图说明哪一种模型的预测准确性更高;而利润图说明样本取多大时是有利可图。
2)分类矩阵
用于比较实际值与预测值间的差别
2、其它模型的准确度
对于非预测模型,模型评价根据算法不同而不同。
1)关联规则算法
通过查看项集的支持度和规则的可能性和重要性。
2)聚类与序列聚类
对于模型质量的评分往往不是很有用,应当从业务角度评价它
3)时间序列
预测图形中点与点间的距离越小表示预测结果越可靠。
二、建立数据挖掘查询和报表
1、BIDS与SSMS中预测查询
在mining model prediction tab 选择挖掘结构和测试集,会自动进行字段关联
2、DMX语言
DMX的DDL语句包括:
CREATE MINING STRUCTURE
ALTER MINING STRUCTURE
CREATE MINING MODEL
EXPORT
IMPORT
SELECT INTO 复制已存在的挖掘模型
DROP MINING MODEL
DROP MINING STRUCTURE
3、DMX DML 语句包括:
SELECT INTO
SELECT
SELECT DISTINCT FROM <MODEL>
SELECT FROM <MODEL>.CONTENT
SELECT FROM <MODEL>.CASES
SELECT FROM <MODEL>SAMPLE_CASES
SELECT FROM <MODEL>.DIMENTION_CONTENT
SELECT FROM <MODEL> PREDICTION JOIN
UPDATE
DELTE 清除结构或者模型的内容
注意:DMX中可以使用VBA函数
4、报表中使用DMX
DMX也可以做为报表的数据源
三、数据挖掘模型的安全
1、SSAS属性
l AllowSessionMiningModel 作用域在会话内
l AllowAdHocOpenRowsetQueries 是否可以使用openrowset函数,也可以在surface area configuration tool中设置
l AllowedProvidersInOpenRowset OpenRowset函数中允许使用的数据源提供者
l MaxConcurrentPredictionQueries
l 另外还有九个个属性用于控制九个数据挖掘算法是否可用
2、SSAS角色、权限和数据源
1)SSAS访问数据源一般有两个目的:
l 训练数据库对象
l 执行MDX查询预测和下钻明细数据
2)访问数据源角色选择有以下几种:
l 使用特定的用户名和密码。为一个数据源建立一个Windows用户,它有访问该数据源的权限,并指定了密码。
l 使用SSAS服务帐号。
l 使用当前用户的信任关系。以执行预测查询的用户身份执行。
l 默认。执行MDX查询使用当前用户模拟,而处理数据库对象使用服务帐号。
3)SSAS角色拥有的权限包括:
类别 | 权限 | 取值 | 描述 |
数据源权限 | Access | Read or None |
|
| Read definition |
|
|
挖掘结构权限 | Access |
|
|
| Read definition |
|
|
| Process |
|
|
挖掘模型权限 | Access | Read/Read,Write/None |
|
| Drill through |
|
|
| Read definition |
|
|
| Browse |
| Browse content |
要想使用SSMS或者BIDS连接SSAS库,必须给予一个用户在SSAS库级别上读取定义的权限。但不建议在生产环境这样使用。
四、总结
1、SSAS角色只支持对数据源、挖掘结构、挖掘模型的访问控制。
2、SSAS只支持Windows认证方式。
3、模型建立后,模型评价就很重要。
…