我正在弄一个爬虫程序爬取豆瓣十部电影的相关数据,现在已经爬取出数据
代码如下:
from urllib import request
from bs4 import BeautifulSoup
response = request.urlopen("https://movie.douban.com/chart")
html = response.read()
soup=BeautifulSoup(html,'lxml')
for i in soup.find_all('a',class_="nbg"):
response = request.urlopen(i['href'])
html = response.read()
soup=BeautifulSoup(html,'lxml')
print(soup.title.get_text())
rint(soup.select('div#info > span')[0].get_text())
print(soup.select('div#info > span')[1].get_text())
print(soup.select('div#info > span.actor')[0].get_text())
print(soup.select('div#info > span')[4].get_text())
输出效果如下:
我尝试过使用csvdata但是网络上的教程看不懂
没法解决的是如何将爬取得到的内容写入CSV或者XLS中,理想的效果如下:
大神们可否告知如何操作 感激不尽!