代码前准备:
1.使用Eclipse进行开发,关于eclipse搭建python的环境见:https://www.cnblogs.com/telwanggs/p/7016803.html
2.使用bs4的BeautifulSoup
3.使用MySQL for Python连接数据库。
4.数据库表的设计:
一、主函数代码(doubanInsect.py)
import datetime
import pymysql
from douban.ranke_dao import insert_message
from douban.ranke_dao import find_message
from douban.html_outputer import output_html
from bs4 import BeautifulSoup
from pip._vendor import requests
allMovie=[]
connect = pymysql.connect(host='localhost', user='root', password='1111', db='python_class')#这些你的数据库信息,db为数据库名
def getHTMLText(url):#获取豆瓣电影网站的h5代码
try:
r = requests.get(url, timeout=30)
r.raise_for_status()
r.encoding = 'utf-8'
return r.text
except:
return ""
def fillRanke(soup):#定位到一周口碑电影排行榜的div,并且获取每条数据并保存在allMovie
data = soup.find_all('div', class_="billboard-bd")
for td in data:
ltd =