![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
JAnedun
这个作者很懒,什么都没留下…
展开
-
python练习简单爬取豆瓣网top250电影信息
一个刚开始学习python的小菜菜,欢迎大家给予指正。因为有的电影详情里没有影片的又名,所以没有爬取电影的又名。基本思路:爬取top250列表页展示中电影的排行榜排名,电影详情链接,电影名称。然后通过电影链接进入到详情页,获取详情页的源码,再进行爬取,爬取后的数据保存在字典中,通过字典保存在mongo数据库中的。 from urllib.request import Reques...原创 2019-01-14 11:05:07 · 761 阅读 · 0 评论 -
初学:简单爬取糗事百科段子
糗事百科属于静态文章爬取静态网站关键点:写正则表达式引包: sqlite3数据库包: import sqlite3 正则表达式: import re 负责打开浏览url内的html 文本: from urllib.request import Request, u...原创 2019-01-14 11:58:33 · 248 阅读 · 3 评论