- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 python爬虫05
# encoding: utf-8 #加载bs4、re正则、random随机数、pymssql数据库 from bs4 import BeautifulSoup import re import random import pymssql import urllib2 import os import re import requests import time ''' 写这个程序的思路: 1:
2017-08-13 13:10:01 218
原创 python爬虫04
不多说了,上代码,看注释吧,写的够详细了 # encoding: utf-8 #加载bs4、urllib2 from bs4 import BeautifulSoup import urllib2 import codecs import re import sys import types #定义一个方法,方法的作用提交url并获取到到此url的html页面源码 def header (
2017-08-07 23:39:52 201
原创 python爬虫03
直接上代码 # encoding: utf-8 #加载bs4、urllib2 from bs4 import BeautifulSoup import urllib2 import re #定义一个方法,方法的作用提交url并获取到到此url的html页面源码 def header (url): user_agent = 'Mozilla/5.0 (Windows NT 6.1; W
2017-08-07 16:32:57 219
原创 python爬虫系列二
# encoding: utf-8 from bs4 import BeautifulSoup import urllib2 import re def header (url): user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.245
2017-08-06 18:50:26 226
原创 python爬虫系列一
不多说直接放代码 # encoding: utf-8 #加载bs4的包里面的beatifusoup类 from bs4 import BeautifulSoup #加载urllib,爬虫必备 import urllib #声明一个变量,传入url给url的变量 url = 'https://www.douban.com/tag/小说/?focus=book' #调用urllib类里面的u
2017-08-04 22:12:33 302
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人