自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 缺失值与超出范围值处理实验报告

可以看到Announcem...(AnnouncementsView)字段的「值」为[1.0,110.0],「缺失」列标记为「丢弃」,说明该字段存在超出合理范围的异常值(业务中该指标合理范围应为 0-100,110 为异常值)。SPSS Modeler 通过数据流(Stream) 实现数据处理:从源节点导入数据,通过类型节点定义字段属性,对异常 / 缺失值进行丢弃 / 填充处理,最终通过输出节点验证处理结果,形成完整的数据清洗链路。

2026-04-13 11:39:36 336

原创 2023级大数据与学习分析课堂笔记

大数据时代数据分析:用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据挖掘:从大量的数据中通过算法搜索隐藏于其中信息的过程,是数据库知识发现中的一个步骤。数据仓库:为企业的决策制定,提供所有类型数据支持的战略集合。它是单个数据存储,出于数据分析和决策支持目的而创建。为需要业务智能的企业,提供业务流程改进、成本质量控制等方面的指导。

2026-04-13 11:23:01 517

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除