一个人,一辆摩托车,车后插着一面寻子旗帜,很多人通过电影《失孤》认识了郭刚堂。二十多年来,他一直在锲而不舍地做一件事——寻找被拐走的儿子郭新振。7月13日,公安部在北京召开发布会,介绍电影《失孤》原型拐卖案件侦破情况:电影中的被拐儿童原型郭新振已被公安机关找到,犯罪嫌疑人被警方抓获。看了整个事件的来龙去脉真的很感动,父母的爱真的很伟大。
关于失踪儿童在我们国家依旧是一个很值得关注的群体,那么今天我们就通过爬虫来获取我们国家失踪儿童的数据,希望可以更好的帮助那些失踪的孩子早点回到父母的身边。
首先我们使用的是Selenium
1、获取http://bbs.baobeihuijia.com/forum-191-1.html这个版块上的所有分页页面链接
2、设置代理, 代理我们可以通过www.16yun.cn获取
3代码信息如下:
from selenium import webdriver
import string
import zipfile
# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理验证信息
proxyUser = "16OKTFDX"
proxyPass = "940952"
def create_proxy_auth_extension(proxy_host, proxy_port,
proxy_username, proxy_password,
scheme='http', plugin_path=None):
if p