2.3.3 在线数据的伦理环境
(1)数据所有权
与社交媒体网站和数据代理相关的个人数据控制权.
(2)被遗忘的权力
从网上删除个人信息,特别是调整互联网上的个人声誉。
(3)身份
拥有得到一个身份和一个准确的身份,或者选择匿名的权力。
(4)在线言论自由
表达自己的观点,而非恃强凌弱、恐怖煽动、“挑衅”或侮辱他人。
2.3.4 违背伦理进行数据处理的风险
数据处理伦理含义的一个方式是去检查大部分人认同的违背伦理的行为。
确保数据可信度包括对数据质量维度的度量(如准确性和时效性),还有基本级别的可信度和透明度-不使用数据欺骗或误导,以及对组织数据处理背后意图、用途和来源保持透明。
1)时机选择
有可能通过遗漏或根据时间将某些数据点包含在报告或活动中而撒谎。这种情况被称为市场择时(MarketTiming),这是非法的行为。
2)可视化误导:图表和图形可用于以误导性方式去呈现数据。
3)定义不清晰或无效的比较: 在展示信息时,符合伦理的做法是交代清楚事情的背景及其意义。不能用统计数据也是非常必要的。
4)偏见
偏见是指一种有倾向性的观点。在个人层面上,这个词与不合理的判断或歧视有关。
偏差有几种类型:
- 预设结论的数据采集。
- 预感和搜索。分析师有一种预感,且想要满足这种预感。
- 片面抽样方法。
- 背景和文化。
偏见的问题源于许多因素,例如,有问题的数据处理类型、涉及的利益相关方、数据集如何填充、正在实现的业务需要以及流程的预期结果。
5)转换和集成数据
- 对数据来源和血缘的了解有限
- 质量差的数据
- 不可靠的元数据
- 没有数据修订历史的文档
6)数据的混淆和修订
- 数据聚合
- 数据标记
- 数据脱敏
混淆和修订数据是进行信息脱敏或信息不公开的常用方法。
2.3.5 建立数据伦理文化
建立一个符合伦理的数据处理文化需要理解现有规范,定义预期行为,并将这些编入相应制度和伦理规范中,并提供相应的培训和监管以强制推行预期行为。
1)评审现有数据处理方法:改善的第一步就是了解组织现在所处的状态。评审现有数据处理流程的目的是为了理解这些方法在多大程度上直接而且明确的与伦理和合规性驱动因素有关。
2)识别原则、实践和风险因素
- 指导性原则
- 风险
- 实践
- 控制
3)制定合乎伦理的数据处理策略和路线图
- 价值观声明。提供了一个符合伦理准则的数据处理和决策制定的框架。
- 符合伦理的数据处理原则。描述了一个组织如何处理数据所带来的挑战。
- 合规框架。合规框架包括驱动组织义务的因素。
- 风险评估。风险评估定义了组织内部特殊问题出现的可能性和影响。
- 培训和交流。培训应该包括对伦理准则的审查。
- 路线图。路线图应包括可由管理层批准的活动时间表。活动将包括执行培训和沟通计划,识别和补救现有实践中的差距、风险缓解和监控计划。
- 审计和监测方法。监测具体活动。
4)采用对社会负责的伦理风险模型
- 他们是谁。
- 他们做什么。
- 他们在哪儿生活。
- 他们被如何对待。
抽样项目的伦理风险模型:
抽样应说明:
- 他们如何选择自己的群体进行研究(箭头1)。
- 数据如何获取(箭头2)
- 活动分析的重点(箭头3)。
- 如何使结果易于理解(箭头4)。
2.3.6 数据伦理和治理
数据处理行为的数据监督属于数据治理和法律顾问范畴。
数据治理必须制定相关标准和制度以提供数据处理和监督的方法。