import pandas as pd
import numpy as np
position= pd. read_csv( 'DataAnalyst.csv' , encoding= 'gbk' )
company= pd. read_csv( 'company_sql.csv' , encoding= 'gbk' )
position. head( )
city companyFullName companyId companyLabelList companyShortName companySize businessZones firstType secondType education industryField positionId positionAdvantage positionName positionLables bottom top avg workYear 0 上海 纽海信息技术(上海)有限公司 8581 ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] 1号店 2000人以上 ['张江'] 技术 数据开发 硕士 移动互联网 2537336 知名平台 数据分析师 ['分析师', '数据分析', '数据挖掘', '数据'] 7 9 8.0 应届毕业生 1 上海 上海点荣金融信息服务有限责任公司 23177 ['节日礼物', '带薪年假', '岗位晋升', '扁平管理'] 点融网 500-2000人 ['五里桥', '打浦桥', '制造局路'] 技术 数据开发 本科 金融 2427485 挑战机会,团队好,与大牛合作,工作环境好 数据分析师-CR2017-SH2909 ['分析师', '数据分析', '数据挖掘', '数据'] 10 15 12.5 应届毕业生 2 上海 上海晶樵网络信息技术有限公司 57561 ['技能培训', '绩效奖金', '岗位晋升', '管理规范'] SPD 50-150人 ['打浦桥'] 设计 数据分析 本科 移动互联网 2511252 时间自由,领导nic 数据分析师 ['分析师', '数据分析', '数据'] 4 6 5.0 应届毕业生 3 上海 杭州数云信息技术有限公司上海分公司 7502 ['绩效奖金', '股票期权', '五险一金', '通讯津贴'] 数云 150-500人 ['龙华', '上海体育场', '万体馆'] 市场与销售 数据分析 本科 企业服务,数据服务 2427530 五险一金 绩效奖金 带薪年假 节日福利 大数据业务分析师【数云校招】 ['商业', '分析师', '大数据', '数据'] 6 8 7.0 应届毕业生 4 上海 上海银基富力信息技术有限公司 130876 ['年底双薪', '通讯津贴', '定期体检', '绩效奖金'] 银基富力 15-50人 ['上海影城', '新华路', '虹桥'] 技术 软件开发 本科 其他 2245819 在大牛下指导 BI开发/数据分析师 ['分析师', '数据分析', '数据', 'BI'] 2 3 2.5 应届毕业生
数据透视 df.pivot_table
position. pivot_table( index= 'city' , columns= 'workYear' , values= 'avg' )
workYear 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 city 上海 13.704403 35.00 9.343750 19.964392 28.328467 10.395161 7.106061 北京 15.745647 43.75 7.697917 21.680512 27.926941 12.404494 6.864078 南京 9.312500 NaN 3.750000 14.750000 20.900000 8.021739 7.500000 厦门 10.333333 NaN NaN 13.400000 NaN 11.055556 7.500000 天津 6.000000 NaN NaN 11.400000 17.500000 7.357143 3.000000 广州 11.011029 NaN 15.000000 14.721649 25.100000 6.947368 4.562500 成都 10.000000 NaN 3.250000 14.670000 18.575000 10.050000 NaN 杭州 12.220859 30.00 6.500000 20.349057 25.172414 14.368421 8.750000 武汉 8.600000 NaN 3.500000 13.722222 16.409091 5.750000 3.500000 深圳 12.960000 26.00 15.250000 19.680905 26.493902 12.180556 8.307692 苏州 11.636364 NaN NaN 13.800000 24.428571 8.333333 7.500000 西安 8.333333 NaN NaN 13.307692 18.500000 3.416667 7.500000 长沙 9.722222 NaN NaN 11.100000 10.500000 6.625000 4.500000
position. pivot_table( index= [ 'city' , 'education' ] , columns= 'workYear' , values= 'avg' )
workYear 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 city education 上海 不限 12.666667 40.000000 6.250000 15.416667 18.500000 13.578125 NaN 博士 12.500000 NaN NaN NaN NaN 20.000000 NaN 大专 10.790698 NaN 4.500000 17.466667 20.500000 5.541667 4.500000 本科 14.259657 38.750000 11.090909 20.547170 27.548246 9.757812 6.942308 硕士 14.477273 22.500000 6.000000 20.800000 41.653846 9.566667 8.250000 北京 不限 14.807692 NaN 9.454545 20.800000 31.571429 13.806452 6.142857 博士 22.500000 NaN NaN 27.500000 NaN NaN NaN 大专 9.931624 NaN 6.642857 18.083333 24.347826 9.900000 5.133333 本科 16.137803 41.041667 7.833333 21.725714 28.011873 12.841667 6.931818 硕士 19.618421 60.000000 4.000000 25.180000 28.775862 11.740000 8.633333 南京 不限 6.500000 NaN NaN NaN 16.000000 3.000000 NaN 大专 9.875000 NaN NaN 14.000000 NaN 4.333333 7.500000 本科 9.500000 NaN 3.750000 14.600000 22.125000 8.038462 7.500000 硕士 NaN NaN NaN 20.000000 NaN 12.200000 NaN 厦门 不限 NaN NaN NaN NaN NaN 12.500000 NaN 大专 7.900000 NaN NaN NaN NaN 4.000000 NaN 本科 11.550000 NaN NaN 13.400000 NaN 11.250000 7.500000 硕士 NaN NaN NaN NaN NaN 15.750000 NaN 天津 不限 NaN NaN NaN NaN NaN 3.500000 NaN 大专 6.000000 NaN NaN NaN NaN 4.000000 NaN 本科 6.000000 NaN NaN 11.400000 17.500000 8.800000 3.000000 广州 不限 5.000000 NaN NaN 13.833333 NaN 8.062500 NaN 大专 8.440476 NaN NaN 12.750000 14.000000 5.633333 4.166667 本科 12.274725 NaN 15.000000 15.493151 26.844828 6.727273 4.800000 硕士 10.500000 NaN NaN 8.666667 30.000000 25.000000 NaN 成都 不限 NaN NaN 3.500000 17.750000 9.500000 9.000000 NaN 大专 8.083333 NaN 3.000000 13.375000 16.666667 6.000000 NaN 本科 10.470588 NaN NaN 14.930556 19.466667 11.750000 NaN 硕士 5.500000 NaN NaN NaN 20.000000 NaN NaN 杭州 不限 13.055556 NaN NaN 25.500000 30.000000 16.142857 10.500000 大专 9.823529 NaN NaN 18.944444 NaN 8.200000 3.750000 本科 12.723684 30.000000 6.500000 19.907692 25.000000 14.659091 9.437500 硕士 15.000000 NaN NaN 34.166667 25.000000 17.375000 11.500000 武汉 不限 7.750000 NaN NaN 16.625000 16.500000 3.666667 NaN 大专 6.833333 NaN NaN 13.357143 13.833333 1.500000 NaN 本科 9.066667 NaN 3.500000 13.156250 17.500000 8.833333 3.500000 硕士 NaN NaN NaN NaN NaN 7.000000 NaN 深圳 不限 11.500000 22.500000 8.000000 18.000000 21.333333 15.750000 3.500000 博士 NaN NaN NaN NaN NaN NaN 35.000000 大专 10.625000 21.500000 NaN 14.416667 25.416667 9.323529 4.250000 本科 13.388393 30.000000 22.500000 20.436747 27.100000 12.681818 8.800000 硕士 19.500000 NaN NaN 21.200000 25.000000 13.928571 NaN 苏州 大专 10.000000 NaN NaN 14.333333 20.000000 NaN NaN 本科 11.875000 NaN NaN 13.666667 24.700000 8.333333 7.500000 硕士 11.500000 NaN NaN NaN 27.500000 NaN NaN 西安 不限 11.500000 NaN NaN NaN NaN 2.500000 NaN 大专 5.500000 NaN NaN 11.250000 13.500000 4.000000 NaN 本科 9.062500 NaN NaN 14.222222 19.750000 3.000000 7.500000 硕士 5.000000 NaN NaN NaN NaN NaN NaN 长沙 不限 9.750000 NaN NaN 7.500000 NaN 6.333333 NaN 大专 NaN NaN NaN 13.500000 NaN NaN 4.500000 本科 9.714286 NaN NaN 12.250000 10.500000 7.500000 NaN 硕士 NaN NaN NaN 9.000000 NaN NaN NaN
p= position. pivot_table( index= 'city' , columns= 'workYear' , values= 'avg' , aggfunc= [ np. sum , np. mean] )
p
sum mean workYear 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 city 上海 4358.0 140.0 149.5 6728.0 3881.0 1289.0 234.5 13.704403 35.00 9.343750 19.964392 28.328467 10.395161 7.106061 北京 20800.0 612.5 369.5 34710.5 12232.0 7728.0 707.0 15.745647 43.75 7.697917 21.680512 27.926941 12.404494 6.864078 南京 223.5 NaN 7.5 354.0 104.5 184.5 30.0 9.312500 NaN 3.750000 14.750000 20.900000 8.021739 7.500000 厦门 155.0 NaN NaN 67.0 NaN 99.5 7.5 10.333333 NaN NaN 13.400000 NaN 11.055556 7.500000 天津 36.0 NaN NaN 57.0 17.5 51.5 3.0 6.000000 NaN NaN 11.400000 17.500000 7.357143 3.000000 广州 1497.5 NaN 15.0 1428.0 878.5 396.0 36.5 11.011029 NaN 15.000000 14.721649 25.100000 6.947368 4.562500 成都 410.0 NaN 6.5 733.5 371.5 201.0 NaN 10.000000 NaN 3.250000 14.670000 18.575000 10.050000 NaN 杭州 1992.0 30.0 13.0 3235.5 730.0 546.0 105.0 12.220859 30.00 6.500000 20.349057 25.172414 14.368421 8.750000 武汉 172.0 NaN 3.5 370.5 180.5 46.0 7.0 8.600000 NaN 3.500000 13.722222 16.409091 5.750000 3.500000 深圳 1944.0 104.0 30.5 3916.5 2172.5 877.0 108.0 12.960000 26.00 15.250000 19.680905 26.493902 12.180556 8.307692 苏州 128.0 NaN NaN 207.0 171.0 25.0 7.5 11.636364 NaN NaN 13.800000 24.428571 8.333333 7.500000 西安 200.0 NaN NaN 173.0 92.5 20.5 15.0 8.333333 NaN NaN 13.307692 18.500000 3.416667 7.500000 长沙 87.5 NaN NaN 111.0 10.5 26.5 4.5 9.722222 NaN NaN 11.100000 10.500000 6.625000 4.500000
type ( p)
pandas.core.frame.DataFrame
p[ 'mean' ]
workYear 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 city 上海 13.704403 35.00 9.343750 19.964392 28.328467 10.395161 7.106061 北京 15.745647 43.75 7.697917 21.680512 27.926941 12.404494 6.864078 南京 9.312500 NaN 3.750000 14.750000 20.900000 8.021739 7.500000 厦门 10.333333 NaN NaN 13.400000 NaN 11.055556 7.500000 天津 6.000000 NaN NaN 11.400000 17.500000 7.357143 3.000000 广州 11.011029 NaN 15.000000 14.721649 25.100000 6.947368 4.562500 成都 10.000000 NaN 3.250000 14.670000 18.575000 10.050000 NaN 杭州 12.220859 30.00 6.500000 20.349057 25.172414 14.368421 8.750000 武汉 8.600000 NaN 3.500000 13.722222 16.409091 5.750000 3.500000 深圳 12.960000 26.00 15.250000 19.680905 26.493902 12.180556 8.307692 苏州 11.636364 NaN NaN 13.800000 24.428571 8.333333 7.500000 西安 8.333333 NaN NaN 13.307692 18.500000 3.416667 7.500000 长沙 9.722222 NaN NaN 11.100000 10.500000 6.625000 4.500000
p[ 'mean' ] [ '3-5年' ] . loc[ '上海' ]
19.96439169139466
position. pivot_table( index= 'city' , columns= 'workYear' , values= 'avg' , margins= 'True' )
workYear 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 All city 上海 13.704403 35.000000 9.343750 19.964392 28.328467 10.395161 7.106061 17.316821 北京 15.745647 43.750000 7.697917 21.680512 27.926941 12.404494 6.864078 18.601615 南京 9.312500 NaN 3.750000 14.750000 20.900000 8.021739 7.500000 11.024390 厦门 10.333333 NaN NaN 13.400000 NaN 11.055556 7.500000 10.966667 天津 6.000000 NaN NaN 11.400000 17.500000 7.357143 3.000000 8.250000 广州 11.011029 NaN 15.000000 14.721649 25.100000 6.947368 4.562500 12.729042 成都 10.000000 NaN 3.250000 14.670000 18.575000 10.050000 NaN 12.951128 杭州 12.220859 30.000000 6.500000 20.349057 25.172414 14.368421 8.750000 16.464109 武汉 8.600000 NaN 3.500000 13.722222 16.409091 5.750000 3.500000 11.297101 深圳 12.960000 26.000000 15.250000 19.680905 26.493902 12.180556 8.307692 17.533525 苏州 11.636364 NaN NaN 13.800000 24.428571 8.333333 7.500000 14.554054 西安 8.333333 NaN NaN 13.307692 18.500000 3.416667 7.500000 10.020000 长沙 9.722222 NaN NaN 11.100000 10.500000 6.625000 4.500000 9.600000 All 14.300045 38.543478 8.040541 20.492329 27.032425 11.559859 6.991713 17.466584
position. pivot_table( index= [ 'city' , 'education' ] ,
columns= 'workYear' ,
values= [ 'avg' , 'top' ] ,
aggfunc= [ np. mean, np. count_nonzero] )
mean ... count_nonzero avg top ... avg top workYear 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 1-3年 10年以上 1年以下 ... 5-10年 不限 应届毕业生 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 city education 上海 不限 12.666667 40.000000 6.250000 15.416667 18.500000 13.578125 NaN 15.944444 50.0 7.500000 ... 3.0 32.0 NaN 18.0 1.0 2.0 12.0 3.0 32.0 NaN 博士 12.500000 NaN NaN NaN NaN 20.000000 NaN 16.000000 NaN NaN ... NaN 1.0 NaN 2.0 NaN NaN NaN NaN 1.0 NaN 大专 10.790698 NaN 4.500000 17.466667 20.500000 5.541667 4.500000 13.581395 NaN 5.500000 ... 7.0 12.0 1.0 43.0 NaN 2.0 45.0 7.0 12.0 1.0 本科 14.259657 38.750000 11.090909 20.547170 27.548246 9.757812 6.942308 17.987124 45.0 14.181818 ... 114.0 64.0 26.0 233.0 2.0 11.0 265.0 114.0 64.0 26.0 硕士 14.477273 22.500000 6.000000 20.800000 41.653846 9.566667 8.250000 18.500000 30.0 7.000000 ... 13.0 15.0 6.0 22.0 1.0 1.0 15.0 13.0 15.0 6.0 北京 不限 14.807692 NaN 9.454545 20.800000 31.571429 13.806452 6.142857 18.769231 NaN 12.090909 ... 7.0 93.0 7.0 52.0 NaN 11.0 40.0 7.0 93.0 7.0 博士 22.500000 NaN NaN 27.500000 NaN NaN NaN 30.000000 NaN NaN ... NaN NaN NaN 2.0 NaN NaN 2.0 NaN NaN NaN 大专 9.931624 NaN 6.642857 18.083333 24.347826 9.900000 5.133333 12.478632 NaN 8.571429 ... 23.0 95.0 15.0 117.0 NaN 14.0 84.0 23.0 95.0 15.0 本科 16.137803 41.041667 7.833333 21.725714 28.011873 12.841667 6.931818 20.667598 50.0 9.666667 ... 379.0 360.0 66.0 1074.0 12.0 21.0 1400.0 379.0 360.0 66.0 硕士 19.618421 60.000000 4.000000 25.180000 28.775862 11.740000 8.633333 25.184211 70.0 5.000000 ... 29.0 75.0 15.0 76.0 2.0 2.0 75.0 29.0 75.0 15.0 南京 不限 6.500000 NaN NaN NaN 16.000000 3.000000 NaN 8.500000 NaN NaN ... 1.0 2.0 NaN 2.0 NaN NaN NaN 1.0 2.0 NaN 大专 9.875000 NaN NaN 14.000000 NaN 4.333333 7.500000 12.000000 NaN NaN ... NaN 3.0 1.0 4.0 NaN NaN 3.0 NaN 3.0 1.0 本科 9.500000 NaN 3.750000 14.600000 22.125000 8.038462 7.500000 11.888889 NaN 5.000000 ... 4.0 13.0 3.0 18.0 NaN 2.0 20.0 4.0 13.0 3.0 硕士 NaN NaN NaN 20.000000 NaN 12.200000 NaN NaN NaN NaN ... NaN 5.0 NaN NaN NaN NaN 1.0 NaN 5.0 NaN 厦门 不限 NaN NaN NaN NaN NaN 12.500000 NaN NaN NaN NaN ... NaN 3.0 NaN NaN NaN NaN NaN NaN 3.0 NaN 大专 7.900000 NaN NaN NaN NaN 4.000000 NaN 10.400000 NaN NaN ... NaN 2.0 NaN 5.0 NaN NaN NaN NaN 2.0 NaN 本科 11.550000 NaN NaN 13.400000 NaN 11.250000 7.500000 14.700000 NaN NaN ... NaN 2.0 1.0 10.0 NaN NaN 5.0 NaN 2.0 1.0 硕士 NaN NaN NaN NaN NaN 15.750000 NaN NaN NaN NaN ... NaN 2.0 NaN NaN NaN NaN NaN NaN 2.0 NaN 天津 不限 NaN NaN NaN NaN NaN 3.500000 NaN NaN NaN NaN ... NaN 1.0 NaN NaN NaN NaN NaN NaN 1.0 NaN 大专 6.000000 NaN NaN NaN NaN 4.000000 NaN 7.333333 NaN NaN ... NaN 1.0 NaN 3.0 NaN NaN NaN NaN 1.0 NaN 本科 6.000000 NaN NaN 11.400000 17.500000 8.800000 3.000000 7.333333 NaN NaN ... 1.0 5.0 1.0 3.0 NaN NaN 5.0 1.0 5.0 1.0 广州 不限 5.000000 NaN NaN 13.833333 NaN 8.062500 NaN 6.000000 NaN NaN ... NaN 8.0 NaN 1.0 NaN NaN 3.0 NaN 8.0 NaN 大专 8.440476 NaN NaN 12.750000 14.000000 5.633333 4.166667 10.523810 NaN NaN ... 5.0 15.0 3.0 42.0 NaN NaN 18.0 5.0 15.0 3.0 本科 12.274725 NaN 15.000000 15.493151 26.844828 6.727273 4.800000 15.637363 NaN 20.000000 ... 29.0 33.0 5.0 91.0 NaN 1.0 73.0 29.0 33.0 5.0 硕士 10.500000 NaN NaN 8.666667 30.000000 25.000000 NaN 13.000000 NaN NaN ... 1.0 1.0 NaN 2.0 NaN NaN 3.0 1.0 1.0 NaN 成都 不限 NaN NaN 3.500000 17.750000 9.500000 9.000000 NaN NaN NaN 4.000000 ... 1.0 4.0 NaN NaN NaN 1.0 2.0 1.0 4.0 NaN 大专 8.083333 NaN 3.000000 13.375000 16.666667 6.000000 NaN 10.333333 NaN 4.000000 ... 3.0 4.0 NaN 6.0 NaN 1.0 12.0 3.0 4.0 NaN 本科 10.470588 NaN NaN 14.930556 19.466667 11.750000 NaN 13.352941 NaN NaN ... 15.0 12.0 NaN 34.0 NaN NaN 36.0 15.0 12.0 NaN 硕士 5.500000 NaN NaN NaN 20.000000 NaN NaN 7.000000 NaN NaN ... 1.0 NaN NaN 1.0 NaN NaN NaN 1.0 NaN NaN 杭州 不限 13.055556 NaN NaN 25.500000 30.000000 16.142857 10.500000 16.888889 NaN NaN ... 1.0 7.0 1.0 9.0 NaN NaN 8.0 1.0 7.0 1.0 大专 9.823529 NaN NaN 18.944444 NaN 8.200000 3.750000 12.382353 NaN NaN ... NaN 5.0 2.0 34.0 NaN NaN 18.0 NaN 5.0 2.0 本科 12.723684 30.000000 6.500000 19.907692 25.000000 14.659091 9.437500 16.333333 40.0 8.000000 ... 24.0 22.0 8.0 114.0 1.0 2.0 130.0 24.0 22.0 8.0 硕士 15.000000 NaN NaN 34.166667 25.000000 17.375000 11.500000 19.166667 NaN NaN ... 4.0 4.0 1.0 6.0 NaN NaN 3.0 4.0 4.0 1.0 武汉 不限 7.750000 NaN NaN 16.625000 16.500000 3.666667 NaN 10.000000 NaN NaN ... 1.0 3.0 NaN 2.0 NaN NaN 4.0 1.0 3.0 NaN 大专 6.833333 NaN NaN 13.357143 13.833333 1.500000 NaN 9.000000 NaN NaN ... 3.0 1.0 NaN 3.0 NaN NaN 7.0 3.0 1.0 NaN 本科 9.066667 NaN 3.500000 13.156250 17.500000 8.833333 3.500000 11.800000 NaN 4.000000 ... 7.0 3.0 2.0 15.0 NaN 1.0 16.0 7.0 3.0 2.0 硕士 NaN NaN NaN NaN NaN 7.000000 NaN NaN NaN NaN ... NaN 1.0 NaN NaN NaN NaN NaN NaN 1.0 NaN 深圳 不限 11.500000 22.500000 8.000000 18.000000 21.333333 15.750000 3.500000 13.833333 30.0 10.000000 ... 3.0 4.0 1.0 6.0 1.0 1.0 4.0 3.0 4.0 1.0 博士 NaN NaN NaN NaN NaN NaN 35.000000 NaN NaN NaN ... NaN NaN 1.0 NaN NaN NaN NaN NaN NaN 1.0 大专 10.625000 21.500000 NaN 14.416667 25.416667 9.323529 4.250000 13.428571 25.0 NaN ... 18.0 17.0 6.0 28.0 1.0 NaN 24.0 18.0 17.0 6.0 本科 13.388393 30.000000 22.500000 20.436747 27.100000 12.681818 8.800000 17.125000 37.5 30.000000 ... 60.0 44.0 5.0 112.0 2.0 1.0 166.0 60.0 44.0 5.0 硕士 19.500000 NaN NaN 21.200000 25.000000 13.928571 NaN 26.000000 NaN NaN ... 1.0 7.0 NaN 4.0 NaN NaN 5.0 1.0 7.0 NaN 苏州 大专 10.000000 NaN NaN 14.333333 20.000000 NaN NaN 13.000000 NaN NaN ... 1.0 NaN NaN 1.0 NaN NaN 3.0 1.0 NaN NaN 本科 11.875000 NaN NaN 13.666667 24.700000 8.333333 7.500000 14.875000 NaN NaN ... 5.0 3.0 1.0 8.0 NaN NaN 12.0 5.0 3.0 1.0 硕士 11.500000 NaN NaN NaN 27.500000 NaN NaN 15.000000 NaN NaN ... 1.0 NaN NaN 2.0 NaN NaN NaN 1.0 NaN NaN 西安 不限 11.500000 NaN NaN NaN NaN 2.500000 NaN 15.000000 NaN NaN ... NaN 1.0 NaN 2.0 NaN NaN NaN NaN 1.0 NaN 大专 5.500000 NaN NaN 11.250000 13.500000 4.000000 NaN 7.000000 NaN NaN ... 1.0 3.0 NaN 4.0 NaN NaN 4.0 1.0 3.0 NaN 本科 9.062500 NaN NaN 14.222222 19.750000 3.000000 7.500000 11.750000 NaN NaN ... 4.0 2.0 2.0 16.0 NaN NaN 9.0 4.0 2.0 2.0 硕士 5.000000 NaN NaN NaN NaN NaN NaN 6.000000 NaN NaN ... NaN NaN NaN 2.0 NaN NaN NaN NaN NaN NaN 长沙 不限 9.750000 NaN NaN 7.500000 NaN 6.333333 NaN 11.500000 NaN NaN ... NaN 3.0 NaN 2.0 NaN NaN 2.0 NaN 3.0 NaN 大专 NaN NaN NaN 13.500000 NaN NaN 4.500000 NaN NaN NaN ... NaN NaN 1.0 NaN NaN NaN 1.0 NaN NaN 1.0 本科 9.714286 NaN NaN 12.250000 10.500000 7.500000 NaN 12.571429 NaN NaN ... 1.0 1.0 NaN 7.0 NaN NaN 6.0 1.0 1.0 NaN 硕士 NaN NaN NaN 9.000000 NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN 1.0 NaN NaN NaN
53 rows × 28 columns
position. pivot_table( index= [ 'city' , 'education' ] ,
columns= 'workYear' ,
values= [ 'avg' , 'top' ] ,
aggfunc= { 'avg' : np. mean, 'top' : len } )
avg top workYear 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 1-3年 10年以上 1年以下 3-5年 5-10年 不限 应届毕业生 city education 上海 不限 12.666667 40.000000 6.250000 15.416667 18.500000 13.578125 NaN 18.0 1.0 2.0 12.0 3.0 32.0 NaN 博士 12.500000 NaN NaN NaN NaN 20.000000 NaN 2.0 NaN NaN NaN NaN 1.0 NaN 大专 10.790698 NaN 4.500000 17.466667 20.500000 5.541667 4.500000 43.0 NaN 2.0 45.0 7.0 12.0 1.0 本科 14.259657 38.750000 11.090909 20.547170 27.548246 9.757812 6.942308 233.0 2.0 11.0 265.0 114.0 64.0 26.0 硕士 14.477273 22.500000 6.000000 20.800000 41.653846 9.566667 8.250000 22.0 1.0 1.0 15.0 13.0 15.0 6.0 北京 不限 14.807692 NaN 9.454545 20.800000 31.571429 13.806452 6.142857 52.0 NaN 11.0 40.0 7.0 93.0 7.0 博士 22.500000 NaN NaN 27.500000 NaN NaN NaN 2.0 NaN NaN 2.0 NaN NaN NaN 大专 9.931624 NaN 6.642857 18.083333 24.347826 9.900000 5.133333 117.0 NaN 14.0 84.0 23.0 95.0 15.0 本科 16.137803 41.041667 7.833333 21.725714 28.011873 12.841667 6.931818 1074.0 12.0 21.0 1400.0 379.0 360.0 66.0 硕士 19.618421 60.000000 4.000000 25.180000 28.775862 11.740000 8.633333 76.0 2.0 2.0 75.0 29.0 75.0 15.0 南京 不限 6.500000 NaN NaN NaN 16.000000 3.000000 NaN 2.0 NaN NaN NaN 1.0 2.0 NaN 大专 9.875000 NaN NaN 14.000000 NaN 4.333333 7.500000 4.0 NaN NaN 3.0 NaN 3.0 1.0 本科 9.500000 NaN 3.750000 14.600000 22.125000 8.038462 7.500000 18.0 NaN 2.0 20.0 4.0 13.0 3.0 硕士 NaN NaN NaN 20.000000 NaN 12.200000 NaN NaN NaN NaN 1.0 NaN 5.0 NaN 厦门 不限 NaN NaN NaN NaN NaN 12.500000 NaN NaN NaN NaN NaN NaN 3.0 NaN 大专 7.900000 NaN NaN NaN NaN 4.000000 NaN 5.0 NaN NaN NaN NaN 2.0 NaN 本科 11.550000 NaN NaN 13.400000 NaN 11.250000 7.500000 10.0 NaN NaN 5.0 NaN 2.0 1.0 硕士 NaN NaN NaN NaN NaN 15.750000 NaN NaN NaN NaN NaN NaN 2.0 NaN 天津 不限 NaN NaN NaN NaN NaN 3.500000 NaN NaN NaN NaN NaN NaN 1.0 NaN 大专 6.000000 NaN NaN NaN NaN 4.000000 NaN 3.0 NaN NaN NaN NaN 1.0 NaN 本科 6.000000 NaN NaN 11.400000 17.500000 8.800000 3.000000 3.0 NaN NaN 5.0 1.0 5.0 1.0 广州 不限 5.000000 NaN NaN 13.833333 NaN 8.062500 NaN 1.0 NaN NaN 3.0 NaN 8.0 NaN 大专 8.440476 NaN NaN 12.750000 14.000000 5.633333 4.166667 42.0 NaN NaN 18.0 5.0 15.0 3.0 本科 12.274725 NaN 15.000000 15.493151 26.844828 6.727273 4.800000 91.0 NaN 1.0 73.0 29.0 33.0 5.0 硕士 10.500000 NaN NaN 8.666667 30.000000 25.000000 NaN 2.0 NaN NaN 3.0 1.0 1.0 NaN 成都 不限 NaN NaN 3.500000 17.750000 9.500000 9.000000 NaN NaN NaN 1.0 2.0 1.0 4.0 NaN 大专 8.083333 NaN 3.000000 13.375000 16.666667 6.000000 NaN 6.0 NaN 1.0 12.0 3.0 4.0 NaN 本科 10.470588 NaN NaN 14.930556 19.466667 11.750000 NaN 34.0 NaN NaN 36.0 15.0 12.0 NaN 硕士 5.500000 NaN NaN NaN 20.000000 NaN NaN 1.0 NaN NaN NaN 1.0 NaN NaN 杭州 不限 13.055556 NaN NaN 25.500000 30.000000 16.142857 10.500000 9.0 NaN NaN 8.0 1.0 7.0 1.0 大专 9.823529 NaN NaN 18.944444 NaN 8.200000 3.750000 34.0 NaN NaN 18.0 NaN 5.0 2.0 本科 12.723684 30.000000 6.500000 19.907692 25.000000 14.659091 9.437500 114.0 1.0 2.0 130.0 24.0 22.0 8.0 硕士 15.000000 NaN NaN 34.166667 25.000000 17.375000 11.500000 6.0 NaN NaN 3.0 4.0 4.0 1.0 武汉 不限 7.750000 NaN NaN 16.625000 16.500000 3.666667 NaN 2.0 NaN NaN 4.0 1.0 3.0 NaN 大专 6.833333 NaN NaN 13.357143 13.833333 1.500000 NaN 3.0 NaN NaN 7.0 3.0 1.0 NaN 本科 9.066667 NaN 3.500000 13.156250 17.500000 8.833333 3.500000 15.0 NaN 1.0 16.0 7.0 3.0 2.0 硕士 NaN NaN NaN NaN NaN 7.000000 NaN NaN NaN NaN NaN NaN 1.0 NaN 深圳 不限 11.500000 22.500000 8.000000 18.000000 21.333333 15.750000 3.500000 6.0 1.0 1.0 4.0 3.0 4.0 1.0 博士 NaN NaN NaN NaN NaN NaN 35.000000 NaN NaN NaN NaN NaN NaN 1.0 大专 10.625000 21.500000 NaN 14.416667 25.416667 9.323529 4.250000 28.0 1.0 NaN 24.0 18.0 17.0 6.0 本科 13.388393 30.000000 22.500000 20.436747 27.100000 12.681818 8.800000 112.0 2.0 1.0 166.0 60.0 44.0 5.0 硕士 19.500000 NaN NaN 21.200000 25.000000 13.928571 NaN 4.0 NaN NaN 5.0 1.0 7.0 NaN 苏州 大专 10.000000 NaN NaN 14.333333 20.000000 NaN NaN 1.0 NaN NaN 3.0 1.0 NaN NaN 本科 11.875000 NaN NaN 13.666667 24.700000 8.333333 7.500000 8.0 NaN NaN 12.0 5.0 3.0 1.0 硕士 11.500000 NaN NaN NaN 27.500000 NaN NaN 2.0 NaN NaN NaN 1.0 NaN NaN 西安 不限 11.500000 NaN NaN NaN NaN 2.500000 NaN 2.0 NaN NaN NaN NaN 1.0 NaN 大专 5.500000 NaN NaN 11.250000 13.500000 4.000000 NaN 4.0 NaN NaN 4.0 1.0 3.0 NaN 本科 9.062500 NaN NaN 14.222222 19.750000 3.000000 7.500000 16.0 NaN NaN 9.0 4.0 2.0 2.0 硕士 5.000000 NaN NaN NaN NaN NaN NaN 2.0 NaN NaN NaN NaN NaN NaN 长沙 不限 9.750000 NaN NaN 7.500000 NaN 6.333333 NaN 2.0 NaN NaN 2.0 NaN 3.0 NaN 大专 NaN NaN NaN 13.500000 NaN NaN 4.500000 NaN NaN NaN 1.0 NaN NaN 1.0 本科 9.714286 NaN NaN 12.250000 10.500000 7.500000 NaN 7.0 NaN NaN 6.0 1.0 1.0 NaN 硕士 NaN NaN NaN 9.000000 NaN NaN NaN NaN NaN NaN 1.0 NaN NaN NaN
数据输出 to_csv和to_excel
p. reset_index( ) . to_csv( 'p.csv' , encoding= 'gbk' )
help ( pd. DataFrame. to_csv)
Help on function to_csv in module pandas.core.frame:
to_csv(self, path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True, escapechar=None, decimal='.')
Write DataFrame to a comma-separated values (csv) file
Parameters
----------
path_or_buf : string or file handle, default None
File path or object, if None is provided the result is returned as
a string.
sep : character, default ','
Field delimiter for the output file.
na_rep : string, default ''
Missing data representation
float_format : string, default None
Format string for floating point numbers
columns : sequence, optional
Columns to write
header : boolean or list of string, default True
Write out the column names. If a list of strings is given it is
assumed to be aliases for the column names
index : boolean, default True
Write row names (index)
index_label : string or sequence, or False, default None
Column label for index column(s) if desired. If None is given, and
`header` and `index` are True, then the index names are used. A
sequence should be given if the DataFrame uses MultiIndex. If
False do not print fields for index names. Use index_label=False
for easier importing in R
mode : str
Python write mode, default 'w'
encoding : string, optional
A string representing the encoding to use in the output file,
defaults to 'ascii' on Python 2 and 'utf-8' on Python 3.
compression : string, optional
A string representing the compression to use in the output file.
Allowed values are 'gzip', 'bz2', 'zip', 'xz'. This input is only
used when the first argument is a filename.
line_terminator : string, default ``'\n'``
The newline character or character sequence to use in the output
file
quoting : optional constant from csv module
defaults to csv.QUOTE_MINIMAL. If you have set a `float_format`
then floats are converted to strings and thus csv.QUOTE_NONNUMERIC
will treat them as non-numeric
quotechar : string (length 1), default '\"'
character used to quote fields
doublequote : boolean, default True
Control quoting of `quotechar` inside a field
escapechar : string (length 1), default None
character used to escape `sep` and `quotechar` when appropriate
chunksize : int or None
rows to write at a time
tupleize_cols : boolean, default False
.. deprecated:: 0.21.0
This argument will be removed and will always write each row
of the multi-index as a separate row in the CSV file.
Write MultiIndex columns as a list of tuples (if True) or in
the new, expanded format, where each MultiIndex column is a row
in the CSV (if False).
date_format : string, default None
Format string for datetime objects
decimal: string, default '.'
Character recognized as decimal separator. E.g. use ',' for
European data
p. reset_index( ) . to_excel( 'p.xlsx' , encoding= 'gbk' )