![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
平凡的过吧
这个作者很懒,什么都没留下…
展开
-
BeautifulSoup库使用
写在前面:目前本人正在自学Python,渣新手,如果有什么问题,也是纯粹个人理解,如有错误,还是欢迎各位大佬指正。自学爬虫过程中,本人第一个练手项目爬取了k站的图片,使用正则表达式匹配图片时会出现其他一些我不需要的内容,于是正则写成了这样reg = r'class="directlink largeimg" href="(.+?.jpg)"'个人认为肯定是有问题的,不过好在...原创 2019-07-25 15:56:34 · 423 阅读 · 0 评论 -
Python爬虫实例-爬取豆瓣电影Top250
这是本人Python爬虫实例的第二个实例,不过想来好像没有很大的难度所以适合当做新手入门的第一个爬虫。放在这里供大家参考。本次实例爬取的网站为豆瓣电影Top250,使用到的第三方库有urllib,BeautifulSoup,以及将数据写入mysql所需的pymysql库分析html代码chrom打开豆瓣电影Top250,F12查看源代码,鼠标移至各个div查看div的覆盖情况,最终确定电...原创 2019-07-26 17:08:33 · 2816 阅读 · 2 评论