# -*- coding:UTF-8 -*-
from bs4 import BeautifulSoup
import sys
import pandas as pd
import re
import requests
def sgw():
s=requests.session()
headers={
'Accept':'*/*',
'Accept-Encoding':'gzip, deflate',
'Accept-Language':'zh-CN,zh;q=0.9',
'Connection':'keep-alive',
'Host':'movie.mtime.com',
'Referer':'http://movie.mtime.com/boxoffice/',
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.15 Safari/537.36',
'X-Requested-With':'XMLHttpRequest',
}
s.headers.update(headers)
df = pd.DataFrame(columns=('排名', '电影', '类型', '首日票房(元)', '年度票房(元)', '上映日期'))
x=0
for i in range(10):
python 爬取时光网电影票房数据
最新推荐文章于 2024-07-23 16:58:49 发布
本文介绍如何使用Python进行网络爬虫,从时光网获取最新电影的票房信息,详细阐述了爬取过程及数据处理方法,通过实例展示了数据分析的结果和洞见。
摘要由CSDN通过智能技术生成