通过爬虫获取失踪儿童信息

一个人,一辆摩托车,车后插着一面寻子旗帜,很多人通过电影《失孤》认识了郭刚堂。二十多年来,他一直在锲而不舍地做一件事——寻找被拐走的儿子郭新振。7月13日,公安部在北京召开发布会,介绍电影《失孤》原型拐卖案件侦破情况:电影中的被拐儿童原型郭新振已被公安机关找到,犯罪嫌疑人被警方抓获。看了整个事件的来龙去脉真的很感动,父母的爱真的很伟大。
关于失踪儿童在我们国家依旧是一个很值得关注的群体,那么今天我们就通过爬虫来获取我们国家失踪儿童的数据,希望可以更好的帮助那些失踪的孩子早点回到父母的身边。
首先我们使用的是Selenium
1、获取http://bbs.baobeihuijia.com/forum-191-1.html这个版块上的所有分页页面链接
2、设置代理, 代理我们可以通过www.16yun.cn获取
3代码信息如下:

from selenium import webdriver
    import string
    import zipfile

    # 代理服务器(产品官网 www.16yun.cn)
    proxyHost = "t.16yun.cn"
    proxyPort = "31111"

    # 代理验证信息
    proxyUser = "16OKTFDX"
    proxyPass = "940952"

    def create_proxy_auth_extension(proxy_host, proxy_port,
                                   proxy_username, proxy_password,
                                   scheme='http', plugin_path=None):
        if p
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值