xpath的相关知识--51job获取的数据写入表格

最新推荐文章于 2022-01-13 18:05:48 发布

心月流云

最新推荐文章于 2022-01-13 18:05:48 发布

阅读量846

点赞数

分类专栏： python36(2018-2-28)

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guifei010/article/details/79404876

版权

该博客介绍了如何通过网页解析方式，特别是XPath，从51job网站获取工资和工作名称等信息。在获取数据后，进行了判断处理，并将结果整理成CSV格式，详细展示了代码实现过程，包括两种写入CSV的方法。

摘要由CSDN通过智能技术生成

第一部分

一.网页的解析方式

    1.xpath（简单）
    2.正则（最难）
    3.css（需要懂网页的css）
    4.bs4（比xpath难一点点）
二.xpath的基本方法
    1.环境准备：
        火狐浏览器（49.0以下）
        firebug
        firepath
    2.基本操作
        // 元素标签名
        例如：//div,查找网页内的所有div

        // 元素标签名[@属性名=‘具体内容’]
        例如：//div[@class='box'],查找class为box的div

        // 元素标签名[第几个]
        例如： //div[@class='box'][2],查找符合条件的第二个div

        //元素1/元素2/元素3...
        例如：//ul/li/div/a/img,查找ul下的li下的div下的a下的img标签

        //元素1/@属性名
        例如：//ul/li/div/a/img/@src,查找ul下的li下的div下的a下的img标签的src属性

        //元素/text()
        例如：//a/text(),获取a标签之间的文本（一级文本）

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

心月流云 CSDN认证博客专家 CSDN认证企业博客

码龄7年

108: 原创

18万+: 周排名

228万+: 总排名

20万+: 访问

: 等级

2624: 积分

35: 粉丝

35: 获赞

11: 评论

148: 收藏

私信

关注

热门文章

分类专栏

最新评论

sorted()函数--排序--数字排序--字符串排序
貔貅test: 中文字符串的排序呢
bs4_lxml的基本用法（不同于正则和xpath）
RUnewhand: 今天刚试了，用python3，可以跑通
字典--取key、取value、元组、键值对，添加，删除
libbb-: 找出现次数，可以使用collections.Counter
字典--取key、取value、元组、键值对，添加，删除
weixin_58179691: 想利用列表array取id前缀名，然后拼接#变成指向id，然后拼接n就可以精确取到不同行id对应的val值，然后利用append存进data_array的字典嵌套列表里，语法不知道对不对 [code=javascript] var array = ["pkey", "serialnumber", "name", "install", "genre", "number", "audience", "description", "size", "medium", "principal", "img", "status"]; var data_array = { 'pkey': [], 'serialnumber': [], 'name': [], 'install': [], 'genre': [], 'number': [], 'audience': [], 'description': [], 'size': [], 'medium': [], 'principal': [], 'img': [], 'status': [] }; // 将所有的行中的id都放进数组,i为表格总行数 for (var n = 1; n <= i; n++) { // j为遍历数，i行数，每新增一行，都会id=name+1 for (var j = 0; j < array.length; j++) { data_array(j) = $("#'array[j]' '+' n").val.append; } } [/code]
xpath的相关知识--51job获取的数据写入表格
Tisfy: 总结得十分精辟，就像那：东山老，可堪岁晚，独听桓筝。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。