关闭

python爬虫05

# encoding: utf-8 #加载bs4、re正则、random随机数、pymssql数据库 from bs4 import BeautifulSoup import re import random import pymssql import urllib2 import os import re import requests import time ''' 写这个程序的思路: 1:...
阅读(51) 评论(0)

python爬虫04

不多说了,上代码,看注释吧,写的够详细了 # encoding: utf-8 #加载bs4、urllib2 from bs4 import BeautifulSoup import urllib2 import codecs import re import sys import types #定义一个方法,方法的作用提交url并获取到到此url的html页面源码 def header (...
阅读(24) 评论(0)

python爬虫03

直接上代码 # encoding: utf-8 #加载bs4、urllib2 from bs4 import BeautifulSoup import urllib2 import re #定义一个方法,方法的作用提交url并获取到到此url的html页面源码 def header (url): user_agent = 'Mozilla/5.0 (Windows NT 6.1; W...
阅读(43) 评论(0)

python爬虫系列二

# encoding: utf-8 from bs4 import BeautifulSoup import urllib2 import re def header (url): user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.245...
阅读(27) 评论(0)

python爬虫系列一

不多说直接放代码 # encoding: utf-8 #加载bs4的包里面的beatifusoup类 from bs4 import BeautifulSoup #加载urllib,爬虫必备 import urllib #声明一个变量,传入url给url的变量 url = 'https://www.douban.com/tag/小说/?focus=book' #调用urllib类里面的u...
阅读(23) 评论(0)
    个人资料
    • 访问:165次
    • 积分:50
    • 等级:
    • 排名:千里之外
    • 原创:5篇
    • 转载:0篇
    • 译文:0篇
    • 评论:0条
    文章分类
    文章存档