豆瓣地址 :豆瓣电影 Top 250 (douban.com)
豆瓣界面
1.先分析每一页的url地址
.2.导入要用的模块
3.开始撸代码
(1)doubanUrl :因为我们要进行多页爬取,先在定义的函数WordParse传入一个url
(2)解析数据
接下来获取内容
4.保存得到的数据(保存的数据也放在一个函数中)
5.多页获取(我们这里获取的是十页数据)
!!!内容大概就是这样,csv文件中也可以看
OK!内容到此就结束了!!!
豆瓣界面
1.先分析每一页的url地址
.2.导入要用的模块
3.开始撸代码
(1)doubanUrl :因为我们要进行多页爬取,先在定义的函数WordParse传入一个url
(2)解析数据
接下来获取内容
5.多页获取(我们这里获取的是十页数据)
!!!内容大概就是这样,csv文件中也可以看
OK!内容到此就结束了!!!