python爬取表格指定列_Chrome爬取网页上表格某列的数据

有的时候会有这样一个需求,页面上有个大表格,我需要复制里面的一列到本地。比如,我要从表格里面,复制列出来的所有机器IP(这样比数据库导出方便点~)

首先,先用chrome的开发者工具,找到要复制的列中的某一个单元格,然后选择复制xpath。这样会复制下来这个元素的xpath路径,比如:

//*[@id="machineGroupTable"]/tbody/tr[2]/td[2]

chrome的console,支持用$x()函数直接用xpath来定位元素,因此,可以通过类似这样的js,来获取刚选中单元格所在的所有列:

[cce]

$x('//[@id="machineGroupTable"]/tbody//td[2]')

[/cce]

这样返回的是chrome经过处理的xpath结果,直接就是dom的数组,因此可以直接遍历,获取单元格中的文本。

[cce]

var ip=[];

$x('//[@id="machineGroupTable"]/tbody//td[2]').forEach(function(e){ip.push(e.innerText)})

[/cce]

这样就把这列的所有内容,放到了ip这个数组中。

最后,把ip数组复制出来:

[cce]

copy(ip.join('\n'))

[/cce]

copy也是chrome console内置的命令,可以把传进去的参数复制到剪切板。注意这里要自己join下,不然会直接输出json格式的字符串。

这样,表格的列已经被复制到了剪切板,直接粘贴到需要的文本中即可。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python3是一种广泛使用的编程语言,它提供了强大的数据处理、网络爬取数据分析能力。如果需要爬取网页中的表格数据Python3是一个非常好的选择。 首先,要爬取网页数据,需要使用Python3中的requests和BeautifulSoup模块。requests模块用来发送HTTP请求,获取网页源代码,而BeautifulSoup模块用来解析网页数据,从中提取所需的信息。 接下来,我们需要找到目标网页中的表格。可以通过使用Chrome浏览器的开发者工具(F12快捷键),在Element选项卡中查找表格的class、id或其他属性信息。 找到表格之后,我们可以使用BeautifulSoup模块中的find_all()方法,根据表格的标签和属性来查找并提取表格数据。通过遍历表格中的所有行和,可以将表格数据保存到一个表或字典中,方便后续处理和分析。 最后,要注意网络爬取的合法性和道德性。需要遵守网站的规定和协议,不要过度频繁地访问同一网站,不要损害网站的正常运营和用户权益。 总之,使用Python3爬取网页表格是一项非常有价值的技能,能够帮助我们更好地处理和分析网站上的数据,为我们的工作和研究带来更多的便利和效率。 ### 回答2: Python3是一种高级编程语言,具有易读易写的特点,而爬虫则是利用编程技术获取互联网上特定数据的过程,所以Python3非常适合用于爬取网页表格爬取网页表格的过程可以分为以下几个步骤: 1.导入所需的python模块:我们需要使用Python中的requests、BeautifulSoup、re、pandas等模块。其中requests模块可用于获取网页内容,BeautifulSoup可用于解析网页内容获取我们想要的表格,而re和pandas模块则可以将表格内容转化为合适的格式。 2.使用requests.get请求获取网页内容。 3.将获取的网页内容传给BeautifulSoup进行解析。在这一步中,我们需要找到我们需要爬取表格所在的HTML标签以及表格内部所需要的各个字段,这些要素都可以用BeautifulSoup来获取。 4.设计正则表达式来获取表格中所要的数据。 5.使用pandas模块将获取到的数据转化为DataFrame格式,处理后可以将其保存为CSV等格式的文件。 总的来说,使用Python3爬取网页表格需要深入了解requests、BeautifulSoup、re、pandas等模块的使用方法,同时也要对HTML语法有一定的了解,才能够高效地解析出所需要的数据,并且能够对数据进行处理和统计分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值