- 博客(2)
- 收藏
- 关注
原创 缺失值与超出范围值处理实验报告
可以看到Announcem...(AnnouncementsView)字段的「值」为[1.0,110.0],「缺失」列标记为「丢弃」,说明该字段存在超出合理范围的异常值(业务中该指标合理范围应为 0-100,110 为异常值)。SPSS Modeler 通过数据流(Stream) 实现数据处理:从源节点导入数据,通过类型节点定义字段属性,对异常 / 缺失值进行丢弃 / 填充处理,最终通过输出节点验证处理结果,形成完整的数据清洗链路。
2026-04-13 11:39:36
336
原创 2023级大数据与学习分析课堂笔记
大数据时代数据分析:用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据挖掘:从大量的数据中通过算法搜索隐藏于其中信息的过程,是数据库知识发现中的一个步骤。数据仓库:为企业的决策制定,提供所有类型数据支持的战略集合。它是单个数据存储,出于数据分析和决策支持目的而创建。为需要业务智能的企业,提供业务流程改进、成本质量控制等方面的指导。
2026-04-13 11:23:01
517
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅