数据预处理

最新推荐文章于 2022-04-27 21:49:25 发布

马马也

最新推荐文章于 2022-04-27 21:49:25 发布

阅读量414

点赞数 1

分类专栏：数学建模数学建模文章标签：数学数学建模

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/machi1/article/details/98169835

版权

数学建模同时被 2 个专栏收录

10 篇文章 4 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

一.数据缺失

对缺失数据进行补全（原文链接：https://www.cnblogs.com/jiaxin359/p/8594640.html）

1:人工填充：根据已经掌握的数据的知识进行填充，但是这个方法在数据量很大，缺失值很多的时候明显是不可以的。

2：特殊值填充：将缺失值用unknown表示，这和原来的缺失值的意思还是有一点差别的。在这里unknown可以当做一种取值的可能性。

3：平均值填充。对于数字类型的变量，可以使用没有缺失值的一些信息进行估计，使用用平均值进行的估计称为平均值填充。对于分类变量可以使用众数来进行填充。其实也可以加上一点方差的信息来进行估计，我在后面的例子当中来说明这一点。

4：将数据映射到高维，第二个参考文章。这个方法有点暴力，使得特征的数量大大的增加，但是保留原始数据的全部信息。

5：使用其它的变量来进行预估。这里的方法就多了，包括文章中讲的回归，期望最大化方法和C4.5方法。这里因为都没有接触过，就不写了。

python处理：https://blog.csdn.net/weixin_33909059/article/details/86935677

2.异常数据（噪声数据、离群点）

数据噪声指在一组数据中无法解释的数据变动，就是一些不和其他数据相一致的数据。通常表现为离群点。

文章：https://www.jianshu.com/p/389682aa5429

https://blog.csdn.net/weixin_42144636/article/details/81584372

https://blog.csdn.net/wangyangzhizhou/article/details/83854951

https://blog.csdn.net/lishangyin88/article/details/71189358

https://www.cnblogs.com/xiaohuahua108/p/6237906.html

3.评价指标类型的一致化处理

在已建立的指标体系中，指标集可能同时含有“极大型”和“极小型”指标，也存在“中间型”指标。因此在评价之前必须将评价指标的类型进行一致化处理，即要统一化为极大型指标。

关于具体的一致化处理过程见《数学建模方法及其应用》的213和214页。

此类处理一般在评价问题中，常用于主成分分析法和层次分析法的模型中。

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
数据预处理

一.数据缺失对缺失数据进行补全（原文链接：https://www.cnblogs.com/jiaxin359/p/8594640.html）1:人工填充：根据已经掌握的数据的知识进行填充，但是这个方法在数据量很大，缺失值很多的时候明显是不可以的。2：特殊值填充：将缺失值用unknown表示，这和原来的缺失值的意思还是有一点差别的。在这里unknown可以当做一种取值的可能性。3：平...
复制链接

扫一扫

专栏目录

马马也 CSDN认证博客专家 CSDN认证企业博客

码龄6年

99: 原创

5万+: 周排名

79万+: 总排名

19万+: 访问

: 等级

2957: 积分

75: 粉丝

154: 获赞

22: 评论

901: 收藏

私信

关注

热门文章

分类专栏

最新评论

通过jsp实现用户登陆和注销(通过session保存用户信息)
飞驰人生: <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>登陆界面</title> </head> <body> <form method="post" action="login.jsp"> 用户名<input type="text" name="username"><br> 密码<input type="password" name="passward"><br> <input type="submit" value="提交"> </form> <% String s1 = request.getParameter("username"); String s2 = request.getParameter("passward"); if(s1 == null&& s2 == null){ }else if(s1.equals("sdnu")&& s2.equals("1234")){ session.setAttribute("username", s1); session.setAttribute("password", s2); out.println("登陆成功" + "<br>"); out.println("<a href='welcome.jsp'>" + "点击这里返回主页面" + "</a>"); /* out.println(s1 + " , " + s2); out.println("用户名或密码错误"); */ } else{ //out.println(s1 + " , " + s2); out.println("用户名或密码错误"); /* session.setAttribute("username", s1); session.setAttribute("password", s2); out.println("登陆成功"); */ } %> </body> </html>
Java中使用try语句实现自动关闭输入输出流
yang834774322: 可以多行的，任何实现了java.lang.AutoCloseable、java.io.Closeable接口都可以被当做资源回收。而且里面仅有一条语句的话也不必有分号
数组倒序输出
信点什么好呢: 现在Collections.reverse（list）一行代码就完了
C语言中简单静态链表的建立实例
weixin_57345936: 简单的
C语言中简单静态链表的建立实例
weixin_57345936: 是

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。