python+selenium小结17:获取表格中指定的列的数据,并保存到文件中

"""获取表格中指定的列的数据,并保存到指定的文件中"""

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import time

a_url = 'http://31f.cn/'
html = requests.get(a_url)
pagesource = html.text
soup = BeautifulSoup(pagesource, 'html.parser')

trs = soup.find('table', class_='table table-striped').find_all('tr')  # 查找列表中所有行
time_count = time.strftime('%Y%m%d%H%M%S', time.localtime(time.time()))  # 获取当前时间,并格式化时间
file_path = "/Users/自己的路径/agent_id_" + str(
    time_count) + ".txt"  # 存储的路径,文件名以当前时间来命名
f = open(file_path, "w")  # 没有就创建一个proxy_agent_id.txt的文件,赋予写权限
# 将查找出来的ip和端口号保存到文件中
for x in range(1, len(trs)):
    tr = trs[x]  # 取出第x行数据
    tds = tr.findAll("td")  # 在第x行中查找每列的值
    td_temp = tds[1].contents[0] + "\t" + tds[2].contents[0] + "\n"  # 取出第2列和第3列的值
    f.write(td_temp)  # 将取出来的值存放到file_path对应文件中
    print('打印IP地址和端口号:\n', td_temp)
f.close()  # 关闭文件

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

就想讲点测试

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值