Pandas练习题

1、基础题

1.将下面的字典创建为DataFrame

data = {"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"],
       "score":[1,2,np.nan,4,5,6,7,10]}

2.提取含有字符串"Python"的行

3.输出df的所有列名

4.修改第二列列名为’popularity’

5.统计grammer列中每种编程语言出现的次数

6.将空值用上下值的平均值填充

7.提取popularity列中值大于3的行

8.按照grammer列进行去除重复值

9.计算popularity列平均值

10.将grammer列转换为list

11.将DataFrame保存为EXCEL

12.查看数据行列数

13.提取popularity列值大于3小于7的行

14.交换两列位置

15.提取popularity列最大值所在行

16.查看最后5行数据

17.删除最后一行数据

18.添加一行数据[‘Perl’,6.6]

19.对数据按照"popularity"列值的大小进行排序

20.统计grammer列每个字符串的长度

2、pandas进行数据处理

21.读取本地EXCEL数据

22.查看df数据前5行

23.将salary列数据转换为最大值与最小值的平均值

24.将数据根据学历进行分组并计算平均薪资

25.将createTime列时间转换为月-日

26.查看索引、数据类型和内存信息

27.查看数值型列的汇总统计

28.新增一列根据salary将数据分为三组

29.按照salary列对数据降序排列

30.取出第33行数据

31.计算salary列的中位数

32.绘制薪资水平频率分布直方图

33.绘制薪资水平密度曲线

34.删除最后一列categories

35.将df的第一列与第二列合并为新的一列

36.将education列与salary列合并为新的一列

37.计算salary最大值与最小值之差

38.将第一行与最后一行拼接

39.将第8行数据添加至末尾

40.查看每列的数据类型

41.将createTime列设置为索引

42.生成一个和df长度相同的随机数dataframe

43.将上一题生成的dataframe与df合并

44.生成新的一列new为salary列减去之前生成随机数列

45.检查数据中是否含有任何缺失值

46.将salary列类型转换为浮点数

47.计算salary大于10000的次数

48.查看每种学历出现的次数

49.查看education列共有几种学历

50.提取salary与new列的和大于60000的最后3行

3、金融数据处理

51.使用绝对路径读取本地Excel数据

52.查看数据前三行

53.查看每列数据缺失值情况

54.提取日期列含有空值的行

55.输出每列缺失值具体行数

56.删除所有存在缺失值的行

57.绘制收盘价的折线图

58.同时绘制开盘价与收盘价

59.绘制涨跌幅的直方图

60.让直方图更细致

61.以data的列名创建一个dataframe

62.打印所有换手率不是数字的行

63.打印所有换手率为–的行

64.重置data的行号

65.删除所有换手率为非数字的行

66.绘制换手率的密度曲线

67.计算前一天与后一天收盘价的差值

68.计算前一天与后一天收盘价变化率

69.设置日期为索引

70.以5个数据作为一个数据滑动窗口,在这个5个数据上取均值(收盘价)

71.以5个数据作为一个数据滑动窗口,计算这五个数据总和(收盘价)

72.将收盘价5日均线、20日均线与原始数据绘制在同一个图上

73.按周为采样规则,取一周收盘价最大值

74.绘制重采样数据与原始数据

75.将数据往后移动5天

76.将数据向前移动5天

77.使用expending函数计算开盘价的移动窗口均值

78.绘制上一题的移动均值与原始数据折线图

79.计算布林指标

80.计算布林线并绘制

4、 当Pandas遇上NumPy

81.导入并查看pandas与numpy版本

82.从NumPy数组创建DataFrame

83.从NumPy数组创建DataFrame

84.从NumPy数组创建DataFrame

85.将df1,df2,df3按照行合并为新DataFrame

86.将df1,df2,df3按照列合并为新DataFrame

87.查看df所有数据的最小值、25%分位数、中位数、75%分位数、最大值

88.修改列名为col1,col2,col3

89.提取第一列中不在第二列出现的数字

90.提取第一列和第二列出现频率最高的三个数字

91.提取第一列中可以整除5的数字位置

92.计算第一列数字前一个与后一个的差值

93.将col1,col2,clo3三列顺序颠倒

94.提取第一列位置在1,10,15的数字

95.查找第一列的局部最大值位置

96.按行计算df的每一行均值

97.对第二列计算移动平均值

98.将数据按照第三列值的大小升序排列

99.将第一列大于50的数字修改为’高’

100.计算第二列与第三列之间的欧式距离

5、补充题

101.从CSV文件中读取指定数据

102.从CSV文件中读取指定数据

103.从上一题数据中,对薪资水平列每隔20行进行一次抽样

104.将数据取消使用科学计数法

105.将上一题的数据转换为百分数

106.查找上一题数据中第3大值的行号

107.反转df的行

108.按照多列对数据进行合并

109.按照多列对数据进行合并

110.再次读取数据1并显示所有的列

111.查找secondType与thirdType值相等的行号

112.查找薪资大于平均薪资的第三个数据

113.将上一题数据的salary列开根号

114.将上一题数据的linestaion列按_拆分

115.查看上一题数据中一共有多少列

116.提取industryField列以’数据’开头的行

117.按列制作数据透视表

118.同时对salary、score两列进行计算

119.对salary求平均,对score列求和

120.计算并提取平均薪资最高的区

重点:题中用到的数据,在本账号资源中可以找到!

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值