Python数据分析
文章平均质量分 79
用数据分析以求最大化地开发数据的功能,发挥数据的作用
随兴随缘
算法领域优质创作者
展开
-
第五章Pandas数据载入与预处理
1:利用下面哪个可视化绘图可以发现数据的异常点A.密度图B.直方图C.盒图D.概率图知识点解析:密度图:表现与数据值对应的边界或域对象的一种理论图形表示方法直方图:直方图是数值数据分布的精确图形表示盒图:是结构化编程中的一种可视化建模概率图:用图来表示变量概率依赖关系的理论2:以下关于缺失值检测的说法中,正确的是A.null和notnull可以对缺失值进行处理B.dropna方法既可以删除观测记录,还可以删除特征C.fillna方法中用来替换缺失值的值只能是数据框D.Pandas库中的原创 2022-12-04 22:49:27 · 5824 阅读 · 0 评论 -
Python数据分析—Pandas可视化
线性表一般用于描述两组数据之间的趋势。原创 2022-10-31 19:57:59 · 639 阅读 · 0 评论 -
第四章 Pandas统计分析基础
22:DataFrame.replace({'B':'E','C':'F'})表示将表中的B替换为___ ,C替换为______8:Pandas的数据对象在进行算术运算时如果存在不同索引会进行数据对齐,但会引入______6:随机抽取数据的语句sample(frac=0.7)中的frac参数的含义是______13:Pandas的数据对象在进行算术运算时如果存在不同索引会进行数据对齐,但会引入___21:Pandas中删除数据时,行列数据通过参数___确定删除的是行还是列。原创 2022-10-30 15:51:29 · 10605 阅读 · 3 评论 -
第三章 NumPy数值计算基础
14:补全计算数组a = np.array([1,2,3,2,3,4,3,4,5,6])和数组b = np.array([7,2,10,2,7,4,9,4,9,8])之间的欧式距离distance的代码。19:补全找出数组np.array([1,2,1,1,3,4, 3,1,1,2,1,1,2])中第五个1出现的位置的代码。18:补全查找数组np.array([1,2,3,2,3,4,3,4,5,6])中的唯一值的数量的代码。知识点解析:np.hsplit(a,2)函数的作用是将数组a横向等分成两个数组。原创 2022-10-29 22:40:50 · 7713 阅读 · 1 评论 -
第二章 Python编程基础综合题目
4:已知字典dic={‘w’:97,’a’:19},则dic.get(‘w’, None)的值是______9:列表、元组和字符串都支持双向索引,有效索引的范围为[-L,L],L为列表、元组或字符串的长度。3:字符串是一个字符序列,例如,字符串s,从右侧向左第3个字符用什么索引?12:字典是存储可变数量键值对的数据结构,键和值可以是任意类型数据结构。2:元组是不可变的,不能直接修改元组中元素的值,也不能为元组增删元素。5:列表、元组和字符串属于有序序列,其中的元素有严格的先后顺序。原创 2022-10-29 16:04:33 · 4944 阅读 · 4 评论 -
第一章 数据分析与可视化概述
数据可视化分析通过对数据不断地观察、分析从而发现有用的信息模式。也可以在Jupyter notebook的cell中运行pip命令执行相应的命令,只需在命令前加“!2:在Jupyter notebook的命令模式下,要查看所有快捷键应该按下的快捷键是。4:简述Jupyter Notebook中编辑模式与命令模式之间的切换方法。3:在Jupyter notebook的cell中安装包语句正确的是。3:简述Jupyter Notebook的安装及第三方包的安装过程。2:简述数据可视化分析的基本过程。原创 2022-10-29 15:31:36 · 1204 阅读 · 0 评论 -
超市营业额数据分析
1.2:数据处理读取表格数据根据日期分类汇总,按交易额求和汇总并取最小的前3位和交易额的列名1.3:输出结果完整代码2:把所有员工的工号前面增加一位数字,增加的数字和原工号最后一位相同,把修改后的数据写入新的文件“超市营业额2_修改工号.xlsx”2.1:导入模块2.2:数据处理读取表格数据把所有员工的工号前面增加一位数字把修改后的数据写入新的文件“超市营业额2_修改工号.xlsx”查看是否写入完整代码3:把每个员工的交易额数据写入文件“各员工数据.xlsx”,每个员工原创 2022-10-27 20:01:18 · 4231 阅读 · 1 评论 -
2016年美国大选数据统计数据分析
数据来源:https://www.kaggle.com/fivethirtyeight/2016-election-polls因为下载数据需要注册登录,比较麻烦,这边为了方便,我直接把需要分析的数据表导出来啦链接:https://pan.baidu.com/s/1IasBj6DcqXvFkJox4Zg2VQ?pwd=7ctn提取码:7ctn参数说明fname读取的CSV文件名delimiter数据的分隔符stype数据类型,默认floatcomments注释。原创 2022-10-25 11:08:53 · 701 阅读 · 0 评论 -
NumPy数值计算基础实训
读取iris数据集中鸢尾花的萼片、花瓣长度数据(已保存为CSV格式),并对其进行排序、去重,并求出和、累积和、均值、标准差、方差、最小值、最大值。输出数据获取的数据看一下是否正确,为了方便查看每两组数据为一行。3.熟练掌握NumPy数组读写及数据统计分析。2.熟练掌握NumPy索引和切片;1.熟练掌握NumPy多维数组;每行三组数据输出是否正确。原创 2022-10-20 20:19:31 · 3417 阅读 · 0 评论 -
Python编程基础
①:一个n位正整数,如果其各位数字的n次方累加之和仍然等于这个数,那么这个数称为自幂数。比如,13+53+33=153,所以153就是一个3位自幂数,3位自幂数又称水仙花数。③:检验一个数是不是自幂数,需要取出这个数每一位的数字。②:遍历所有的n位数,首先需要生成n位数的最小值和最大值,在此范围内寻找自幂数。一个n位数的最小值为10n-1,最大值为10n-1。从键盘输入系数a、b和c,如果方程有实根,计算并输出所有实根,否则,显示“方程无实根”。输入位数n,输出所有n位数的自幂数。原创 2022-10-17 11:29:22 · 893 阅读 · 0 评论 -
Python数据分析——白葡萄酒实训
【代码】Python数据分析——白葡萄酒实训。原创 2022-10-15 23:10:07 · 3750 阅读 · 3 评论