Pandas的set_index和reset_index用法

set_index():

函数原型:DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 

参数解释:

keys:列标签或列标签/数组列表,需要设置为索引的列

drop:默认为True,删除用作新索引的列

append:默认为False,是否将列附加到现有索引

inplace:默认为False,适当修改DataFrame(不要创建新对象)

verify_integrity:默认为false,检查新索引的副本。否则,请将检查推迟到必要时进行。将其设置为false将提高该方法的性能。


 
 
  1. #drop的使用:
  2. import pandas as pd
  3. df = pd.DataFrame({ 'A': [ 'A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11'],
  4. 'B': [ 'B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11'],
  5. 'C': [ 'C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11'],
  6. 'D': [ 'D0', 'D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']})
  7. print (df)
  8. new_df_drop_t = df.set_index( 'A',drop= True, append= False, inplace= False, verify_integrity= False)
  9. print (new_df_drop_t)
  10. new_df_drop_f = df.set_index( 'A',drop= False, append= False, inplace= False, verify_integrity= False)
  11. print (new_df_drop_f)
  12. '''
  13. 输出结果:
  14. A B C D
  15. 0 A0 B0 C0 D0
  16. 1 A1 B1 C1 D1
  17. 2 A2 B2 C2 D2
  18. 3 A3 B3 C3 D3
  19. 4 A4 B4 C4 D4
  20. 5 A5 B5 C5 D5
  21. 6 A6 B6 C6 D6
  22. 7 A7 B7 C7 D7
  23. 8 A8 B8 C8 D8
  24. 9 A9 B9 C9 D9
  25. 10 A10 B10 C10 D10
  26. 11 A11 B11 C11 D11
  27. B C D
  28. A
  29. A0 B0 C0 D0
  30. A1 B1 C1 D1
  31. A2 B2 C2 D2
  32. A3 B3 C3 D3
  33. A4 B4 C4 D4
  34. A5 B5 C5 D5
  35. A6 B6 C6 D6
  36. A7 B7 C7 D7
  37. A8 B8 C8 D8
  38. A9 B9 C9 D9
  39. A10 B10 C10 D10
  40. A11 B11 C11 D11
  41. A B C D
  42. A
  43. A0 A0 B0 C0 D0
  44. A1 A1 B1 C1 D1
  45. A2 A2 B2 C2 D2
  46. A3 A3 B3 C3 D3
  47. A4 A4 B4 C4 D4
  48. A5 A5 B5 C5 D5
  49. A6 A6 B6 C6 D6
  50. A7 A7 B7 C7 D7
  51. A8 A8 B8 C8 D8
  52. A9 A9 B9 C9 D9
  53. A10 A10 B10 C10 D10
  54. A11 A11 B11 C11 D11
  55. '''

 
 
  1. # append的使用
  2. import pandas as pd
  3. df = pd.DataFrame({ 'A': [ 'A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11'],
  4. 'B': [ 'B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11'],
  5. 'C': [ 'C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11'],
  6. 'D': [ 'D0', 'D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']})
  7. new_df_append_t = df.set_index( 'A',drop= True, append= True, inplace= False, verify_integrity= False)
  8. print (new_df_append_t)
  9. new_df_append_f = df.set_index( 'A',drop= True, append= False, inplace= False, verify_integrity= False)
  10. print (new_df_append_f)
  11. '''
  12. 输出结果:
  13. B C D
  14. A
  15. 0 A0 B0 C0 D0
  16. 1 A1 B1 C1 D1
  17. 2 A2 B2 C2 D2
  18. 3 A3 B3 C3 D3
  19. 4 A4 B4 C4 D4
  20. 5 A5 B5 C5 D5
  21. 6 A6 B6 C6 D6
  22. 7 A7 B7 C7 D7
  23. 8 A8 B8 C8 D8
  24. 9 A9 B9 C9 D9
  25. 10 A10 B10 C10 D10
  26. 11 A11 B11 C11 D11
  27. B C D
  28. A
  29. A0 B0 C0 D0
  30. A1 B1 C1 D1
  31. A2 B2 C2 D2
  32. A3 B3 C3 D3
  33. A4 B4 C4 D4
  34. A5 B5 C5 D5
  35. A6 B6 C6 D6
  36. A7 B7 C7 D7
  37. A8 B8 C8 D8
  38. A9 B9 C9 D9
  39. A10 B10 C10 D10
  40. A11 B11 C11 D11
  41. '''

 
 
  1. # inplace的使用,这里我也没搞懂为啥输出None
  2. df = pd.DataFrame({ 'A': [ 'A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11'],
  3. 'B': [ 'B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11'],
  4. 'C': [ 'C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11'],
  5. 'D': [ 'D0', 'D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']})
  6. new_df_inplace_t = df.set_index( 'A', drop= True, append= False, inplace= True, verify_integrity= False)
  7. print (new_df_inplace_t)
  8. print (type(new_df_inplace_t))
  9. df = pd.DataFrame({ 'A': [ 'A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11'],
  10. 'B': [ 'B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11'],
  11. 'C': [ 'C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11'],
  12. 'D': [ 'D0', 'D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']})
  13. new_df_inplace_f = df.set_index( 'A', drop= True, append= False, inplace= False, verify_integrity= False)
  14. print (new_df_inplace_f)
  15. '''
  16. None
  17. <class 'NoneType'>
  18. B C D
  19. A
  20. A0 B0 C0 D0
  21. A1 B1 C1 D1
  22. A2 B2 C2 D2
  23. A3 B3 C3 D3
  24. A4 B4 C4 D4
  25. A5 B5 C5 D5
  26. A6 B6 C6 D6
  27. A7 B7 C7 D7
  28. A8 B8 C8 D8
  29. A9 B9 C9 D9
  30. A10 B10 C10 D10
  31. A11 B11 C11 D11
  32. '''

reset_index():

函数原型:DataFrame.reset_index(level=Nonedrop=Falseinplace=Falsecol_level=0col_fill='')

参数解释:

level:int、str、tuple或list,默认无,仅从索引中删除给定级别。默认情况下移除所有级别。控制了具体要还原的那个等级的索引 

drop:drop为False则索引列会被还原为普通列,否则会丢失

inplace:默认为false,适当修改DataFrame(不要创建新对象)

col_level:int或str,默认值为0,如果列有多个级别,则确定将标签插入到哪个级别。默认情况下,它将插入到第一级。

col_fill:对象,默认‘’,如果列有多个级别,则确定其他级别的命名方式。如果没有,则重复索引名

注:reset_index还原分为两种类型,第一种是对原DataFrame进行reset,第二种是对使用过set_index()函数的DataFrame进行reset

第一种:


 
 
  1. # 一般情况下只使用到drop,这里只演示drop的使用
  2. import pandas as pd
  3. df = pd.DataFrame({ 'A': [ 'A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11'],
  4. 'B': [ 'B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11'],
  5. 'C': [ 'C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11'],
  6. 'D': [ 'D0', 'D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']})
  7. print (df)
  8. newdf = df.set_index( 'A',drop= True, append= False, inplace= False, verify_integrity= False)
  9. # 这里的drop必需为True,否则会报错ValueError: cannot insert A, already exists(意思是...只可意会不可言传哈哈)
  10. print (newdf)
  11. new_reset_index = newdf.reset_index(drop= False) #索引列会被还原为普通列
  12. print (new_reset_index)
  13. new_reset_index = newdf.reset_index(drop= True) #索引回被直接删除
  14. print (new_reset_index)
  15. '''
  16. 输出结果:
  17. A B C D
  18. 0 A0 B0 C0 D0
  19. 1 A1 B1 C1 D1
  20. 2 A2 B2 C2 D2
  21. 3 A3 B3 C3 D3
  22. 4 A4 B4 C4 D4
  23. 5 A5 B5 C5 D5
  24. 6 A6 B6 C6 D6
  25. 7 A7 B7 C7 D7
  26. 8 A8 B8 C8 D8
  27. 9 A9 B9 C9 D9
  28. 10 A10 B10 C10 D10
  29. 11 A11 B11 C11 D11
  30. B C D
  31. A
  32. A0 B0 C0 D0
  33. A1 B1 C1 D1
  34. A2 B2 C2 D2
  35. A3 B3 C3 D3
  36. A4 B4 C4 D4
  37. A5 B5 C5 D5
  38. A6 B6 C6 D6
  39. A7 B7 C7 D7
  40. A8 B8 C8 D8
  41. A9 B9 C9 D9
  42. A10 B10 C10 D10
  43. A11 B11 C11 D11
  44. A B C D
  45. 0 A0 B0 C0 D0
  46. 1 A1 B1 C1 D1
  47. 2 A2 B2 C2 D2
  48. 3 A3 B3 C3 D3
  49. 4 A4 B4 C4 D4
  50. 5 A5 B5 C5 D5
  51. 6 A6 B6 C6 D6
  52. 7 A7 B7 C7 D7
  53. 8 A8 B8 C8 D8
  54. 9 A9 B9 C9 D9
  55. 10 A10 B10 C10 D10
  56. 11 A11 B11 C11 D11
  57. B C D
  58. 0 B0 C0 D0
  59. 1 B1 C1 D1
  60. 2 B2 C2 D2
  61. 3 B3 C3 D3
  62. 4 B4 C4 D4
  63. 5 B5 C5 D5
  64. 6 B6 C6 D6
  65. 7 B7 C7 D7
  66. 8 B8 C8 D8
  67. 9 B9 C9 D9
  68. 10 B10 C10 D10
  69. 11 B11 C11 D11
  70. '''

第二种:


 
 
  1. # 一般情况下只使用到drop,这里只演示drop的使用
  2. import pandas as pd
  3. df = pd.DataFrame({ 'A': [ 'A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11'],
  4. 'B': [ 'B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11'],
  5. 'C': [ 'C0', 'C1', 'C2', 'C3', 'C4', 'C5', 'C6', 'C7', 'C8', 'C9', 'C10', 'C11'],
  6. 'D': [ 'D0', 'D1', 'D2', 'D3', 'D4', 'D5', 'D6', 'D7', 'D8', 'D9', 'D10', 'D11']})
  7. print (df)
  8. new_reset_index = df.reset_index(drop= False) # 原有的索引不变添加列名index,同时在新列上重置索引
  9. print (new_reset_index)
  10. new_reset_index = df.reset_index(drop= True) # 在原有的索引列重置索引,不再另外添加新列。
  11. print (new_reset_index)
  12. '''
  13. 输出结果:
  14. A B C D
  15. 0 A0 B0 C0 D0
  16. 1 A1 B1 C1 D1
  17. 2 A2 B2 C2 D2
  18. 3 A3 B3 C3 D3
  19. 4 A4 B4 C4 D4
  20. 5 A5 B5 C5 D5
  21. 6 A6 B6 C6 D6
  22. 7 A7 B7 C7 D7
  23. 8 A8 B8 C8 D8
  24. 9 A9 B9 C9 D9
  25. 10 A10 B10 C10 D10
  26. 11 A11 B11 C11 D11
  27. index A B C D
  28. 0 0 A0 B0 C0 D0
  29. 1 1 A1 B1 C1 D1
  30. 2 2 A2 B2 C2 D2
  31. 3 3 A3 B3 C3 D3
  32. 4 4 A4 B4 C4 D4
  33. 5 5 A5 B5 C5 D5
  34. 6 6 A6 B6 C6 D6
  35. 7 7 A7 B7 C7 D7
  36. 8 8 A8 B8 C8 D8
  37. 9 9 A9 B9 C9 D9
  38. 10 10 A10 B10 C10 D10
  39. 11 11 A11 B11 C11 D11
  40. A B C D
  41. 0 A0 B0 C0 D0
  42. 1 A1 B1 C1 D1
  43. 2 A2 B2 C2 D2
  44. 3 A3 B3 C3 D3
  45. 4 A4 B4 C4 D4
  46. 5 A5 B5 C5 D5
  47. 6 A6 B6 C6 D6
  48. 7 A7 B7 C7 D7
  49. 8 A8 B8 C8 D8
  50. 9 A9 B9 C9 D9
  51. 10 A10 B10 C10 D10
  52. 11 A11 B11 C11 D11
  53. '''

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值