基于Python的数据分析与数据挖掘教程之四：数据简单处理

最新推荐文章于 2024-06-25 10:33:10 发布

fjqlldg

最新推荐文章于 2024-06-25 10:33:10 发布

阅读量838

点赞数 1

分类专栏：基于Python的数据分析与数据挖掘教程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fjqlldg/article/details/105019421

版权

基于Python的数据分析与数据挖掘教程专栏收录该内容

8 篇文章 3 订阅

订阅专栏

Pandas数据的简单计算是通过对表中数据各字段进行加、减、乘、除的四则运算，得出新的结果，以便对数据有更好的分析与决策。

这是本文要分析的表数据。是学生表。

学号	班级	姓名	性别	政治	数据库技术	高数	C语言程序设计	网页设计	数据分析与挖掘
182024241	1820242	成晨	男	86	75	78	60	62	45
182024244	1820242	周玲	女	76	80	91	44	87	72
182024251	1820242	张伟波	男	95	92	81	60	66	61
182024249	1820242	朱吉	男	75	89	50	71	73	71
182024219	1820242	邱玲	女	63	84	88	46	67	61
182024201	1820242	陈培	男	71	86	50	71	82	69
182024347	1820243	李洁华	女	76	85	61	78	85	65
182024307	1820243	陈珍	男		90	79	69	66	60
182024326	1820243	余龙	男	56	84	67		71	60
182024320	1820243	李佳	女	72	84	67	77	83	64
182024342	1820243	李小龙	男	80	56	90	60	87	61
182024310	1820243	郭芙	女	89	88	67	79	76	68
182024435	1820244	姜涛	男	83		71	76	92	61
182024432	1820244	赵龙宇	男	90	81	74	71	93	63
182024446	1820244	周洁	女	82	77	80	80	84	78
182024421	1820244	王建祥	男	66	91	72	75	94	69
182024433	1820244	李强	男	75	93	76	70	77	70
182024428	1820244	林宇通	男	63	85	96	77	66	72
182024402	1820244	周慧	女	82	82	74	75	65	86
182024422	1820244	郭晓亮	男	86	65	60	83	80	53
182024342	1820243	李小龙	男	80	56	90	60	87	61
182024307	1820243	陈珍	男		90	79	69	66	60

数据的处理过程：

1、导入数据，查看数据量（有几行几列）：结果为22行10列。

2、查看是否有重复有记录，有则删除：表名.duplicated(),查看是否有重复记录

（1）：结果显示有两条记录重复输入了。

（2）、有重复，则删除重复记录，并查看记录：原有22条记录，删除重复记录后有20条记录。

3、查看记录中数据是否存在空值，如果存在，用0填入：isnull(),判断是否为空值。

（1）、判断哪些字段存在空值

（2）、在空值数据中以0填充，并查看。

4、去除数据中的空格，并把数据转为float型数据

（1）、去除数据中的空格。

（2）、因去除空格后，数据变为字符型，所以要把数据变为float型。

5、计算每个同学的总分，并显示前5条记录

6、统计量 describle:对数据做一些基本描述，默认为计算计算数据的基本统计量。

7、频数与频率

（1）、频数

计算学生表中男、女同学的人数。

（2）、频率

计算男、女所占比率

8、在student2中增加一列：平均分，并由总分算出平均分，并显示前5条记录。

9、对成绩进行分类：平均分大于等于80分的为“优秀”，在[70,80)之间为“良好”，70分以下为“一般”

10、求某一学科的平均值

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

fjqlldg CSDN认证博客专家 CSDN认证企业博客

码龄16年

96: 原创

4万+: 周排名

48万+: 总排名

15万+: 访问

: 等级

2444: 积分

251: 粉丝

104: 获赞

40: 评论

622: 收藏

私信

关注

热门文章

分类专栏

最新评论

Qt5 与OpenCV4教程一：Qt5.12安装与OpenCV4.5.0配置
飞鱼气球: CMakeFiles\opencv_highgui.dir/objects.a(moc_window_QT.cpp.obj):moc_window_QT.cpp:(.rdata$_ZTV15DefaultViewPort[_ZTV15DefaultViewPort]+0x290): undefined reference to `non-virtual thunk to QWidget::sharedPainter() const' collect2.exe: error: ld returned 1 exit status mingw32-make[2]: *** [modules\highgui\CMakeFiles\opencv_highgui.dir\build.make:197: bin/libopencv_highgui450.dll] Error 1 mingw32-make[1]: *** [CMakeFiles\Makefile2:2939: modules/highgui/CMakeFiles/opencv_highgui.dir/all] Error 2 mingw32-make: *** [Makefile:162: all] Error 2 你好，我在编译时报出了这样的错误，这是为什么呢？ CMakeFiles\opencv_highgui.dir/objects.a(moc_window_QT.cpp.obj):都是这种，好几十条。
Qt5.14 与 OpenCV4.5 教程二：图片增强
教我改bug: 你好！请问代码是完整的吗？看了三个小时了，有四处报错呜呜呜
Qt5.14 与 OpenCV4.5 教程五：人脸识别
desolatewqwq: 你好可以请问一下吧Qt上的人脸识别程序移植到android上应该怎么操作吗怎么吧深度学习人脸识别替换opencv自带的人脸识别求大佬帮忙
MySQL期中考试上机试题
lamyyy: 欢迎大家私信交流答案哦
MySQL期中考试上机试题
lamyyy: 本人做出来啦，有需要的可以私信哈欢迎大家交流讨论

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。