爬虫
菜鸟挣扎史
本人菜鸟一枚,大学毕业之际半推半就学习半年Java,菜的可以.紧紧记录悲惨的探索史,为后人参考,防止二次装壁!!!!
展开
-
Python3 selenium获取某东平台商家信息 重点为验证码识别 此处采用了网页截图获取验证码-第三方验证码识别
此处验证码识别采取了页面截图外加 第三方识别 冰拖 网址http://www.bingtop.com 价格不是很贵,识别速度也很快 大家可以试试或者自己购买其他平台 我个人也自行编写了文字识别模块 识别率较低正在改进 # -*- coding: utf-8 -*- """ Created on Tue Dec 24 16:14:03 2019 @author: Administrator """...原创 2019-12-27 17:02:46 · 178 阅读 · 0 评论 -
Python3 selenium爬取苏宁商家联系电话 进阶版
此处使用了selenium插件 使用的是火狐浏览器 信息存储到csv表格里面 前面详细不多讲如果条件不满足自行百度安装 相比上一版本稍微改进 可以输入多词 # -*- coding: utf-8 -*- """ Created on Wed Dec 11 20:21:04 2019 @author: Administrator """ from selenium import webdriver...原创 2019-12-24 15:30:42 · 333 阅读 · 0 评论 -
Python3 selenium爬取苏宁商家联系电话
此处使用了selenium插件 使用的是火狐浏览器 信息存储到csv表格里面 前面详细不多讲如果条件不满足自行百度安装 # -*- coding: utf-8 -*- """ Created on Wed Dec 11 20:21:04 2019 @author: Administrator """ from selenium import webdriver import time imp...原创 2019-12-22 11:52:03 · 440 阅读 · 1 评论 -
selenium练习 python
# -*- coding: utf-8 -*- """ Created on Wed Dec 18 15:08:40 2019 @author: Administrator """ from selenium import webdriver #打开浏览器 driver = webdriver.Firefox(executable_path="geckodriver") #打开网页 driver...原创 2019-12-18 16:44:32 · 96 阅读 · 0 评论 -
钢管门户官网产品信息爬取-图片存储-文字存至excel--Python-request
# -*- coding: utf-8 -*- """ Created on Mon Nov 18 14:58:57 2019 @author: Administrator """ import urllib.request as request import lxml.html as html import xlsxwriter import time import random #模拟谷...原创 2019-12-18 15:07:58 · 405 阅读 · 3 评论