>>>import pandas as pd
>>>position=pd.read_csv('DataAnalyst.csv',encoding='gbk')
>>>position.head()
city | companyFullName | companyId | companyLabelList | companyShortName | companySize | businessZones | firstType | secondType | education | industryField | positionId | positionAdvantage | positionName | positionLables | bottom | top | avg | workYear | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 上海 | 纽海信息技术(上海)有限公司 | 8581 | ['技能培训', '节日礼物', '带薪年假', '岗位晋升'] | 1号店 | 2000人以上 | ['张江'] | 技术 | 数据开发 | 硕士 | 移动互联网 | 2537336 | 知名平台 | 数据分析师 | ['分析师', '数据分析', '数据挖掘', '数据'] | 7 | 9 | 8.0 | 应届毕业生 |
1 | 上海 | 上海点荣金融信息服务有限责任公司 | 23177 | ['节日礼物', '带薪年假', '岗位晋升', '扁平管理'] | 点融网 | 500-2000人 | ['五里桥', '打浦桥', '制造局路'] | 技术 | 数据开发 | 本科 | 金融 | 2427485 | 挑战机会,团队好,与大牛合作,工作环境好 | 数据分析师-CR2017-SH2909 | ['分析师', '数据分析', '数据挖掘', '数据'] | 10 | 15 | 12.5 | 应届毕业生 |
2 | 上海 | 上海晶樵网络信息技术有限公司 | 57561 | ['技能培训', '绩效奖金', '岗位晋升', '管理规范'] | SPD | 50-150人 | ['打浦桥'] | 设计 | 数据分析 | 本科 | 移动互联网 | 2511252 | 时间自由,领导nic | 数据分析师 | ['分析师', '数据分析', '数据'] | 4 | 6 | 5.0 | 应届毕业生 |
3 | 上海 | 杭州数云信息技术有限公司上海分公司 | 7502 | ['绩效奖金', '股票期权', '五险一金', '通讯津贴'] | 数云 | 150-500人 | ['龙华', '上海体育场', '万体馆'] | 市场与销售 | 数据分析 | 本科 | 企业服务,数据服务 | 2427530 | 五险一金 绩效奖金 带薪年假 节日福利 | 大数据业务分析师【数云校招】 | ['商业', '分析师', '大数据', '数据'] | 6 | 8 | 7.0 | 应届毕业生 |
4 | 上海 | 上海银基富力信息技术有限公司 | 130876 | ['年底双薪', '通讯津贴', '定期体检', '绩效奖金'] | 银基富力 | 15-50人 | ['上海影城', '新华路', '虹桥'] | 技术 | 软件开发 | 本科 | 其他 | 2245819 | 在大牛下指导 | BI开发/数据分析师 | ['分析师', '数据分析', '数据', 'BI'] | 2 | 3 | 2.5 | 应届毕业生 |
>>>position.positionLables
0 ['分析师', '数据分析', '数据挖掘', '数据']
1 ['分析师', '数据分析', '数据挖掘', '数据']
2 ['分析师', '数据分析', '数据']
3 ['商业', '分析师', '大数据', '数据']
4 ['分析师', '数据分析', '数据', 'BI']
...
6818 ['分析师', '金融', '证券']
6819 ['项目管理', '专员', '助理', '实习生', '风控', '采购', '分析师',...
6820 ['分析师', '职业培训', '教育', '培训', '金融', '证券', '股票', ...
6821 ['实习生', '主管', '经理', '顾问', '销售', '客户代表', '分析师',...
6822 ['分析师', '金融']
Name: positionLables, Length: 6823, dtype: object
str方法针对值里面的字符串
##查找目标在字符串的位置
#>>>position.positionLables.str.find('分析师')
##计算目标在字符串中出现的次数
>>>position.positionLables.str.count("'")
0 8.0
1 8.0
2 6.0
3 8.0
4 8.0
...
6818 6.0
6819 20.0
6820 22.0
6821 26.0
6822 4.0
Name: positionLables, Length: 6823, dtype: float64
#字符串切片去掉首尾
>>>position.positionLables.str[1:-1]
0 '分析师', '数据分析', '数据挖掘', '数据'
1 '分析师', '数据分析', '数据挖掘', '数据'
2 '分析师', '数据分析', '数据'
3 '商业', '分析师', '大数据', '数据'
4 '分析师', '数据分析', '数据', 'BI'
...
6818 '分析师', '金融', '证券'
6819 '项目管理', '专员', '助理', '实习生', '风控', '采购', '分析师', ...
6820 '分析师', '职业培训', '教育', '培训', '金融', '证券', '股票', '...
6821 '实习生', '主管', '经理', '顾问', '销售', '客户代表', '分析师', ...
6822 '分析师', '金融'
Name: positionLables, Length: 6823, dtype: object
#使用替换函数需要再来一次str,才能调用针对字符串的replace
>>>position.positionLables.str[1:-1].str.replace("'","")
0 分析师, 数据分析, 数据挖掘, 数据
1 分析师, 数据分析, 数据挖掘, 数据
2 分析师, 数据分析, 数据
3 商业, 分析师, 大数据, 数据
4 分析师, 数据分析, 数据, BI
...
6818 分析师, 金融, 证券
6819 项目管理, 专员, 助理, 实习生, 风控, 采购, 分析师, 培训, 金融, 证券
6820 分析师, 职业培训, 教育, 培训, 金融, 证券, 股票, 交易, 讲师, 中介, 地产
6821 实习生, 主管, 经理, 顾问, 销售, 客户代表, 分析师, 职业培训, 教育, 培训, ...
6822 分析师, 金融
Name: positionLables, Length: 6823, dtype: object