风骨峰谷
码龄5年
关注
提问 私信
  • 博客:1,790
    1,790
    总访问量
  • 2
    原创
  • 1,021,943
    排名
  • 1
    粉丝
  • 0
    铁粉

个人简介:python小白一枚

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:香港
  • 加入CSDN时间: 2020-09-25
博客简介:

kjadhgfiuao的博客

查看详细资料
个人成就
  • 获得3次点赞
  • 内容获得2次评论
  • 获得7次收藏
创作历程
  • 2篇
    2020年
成就勋章
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python爬虫,使用parsel爬取有时候不能正则的网站

上一篇文章介绍了使用requests爬取某网站的小说,但是有时候很多网站不知道因为什么原因(笔者水平有限真的不知道为什么正则不出来555)不能够爬取到自己想要的html,这时候我们就需要用到解析神器parsel模块,这是python的第三方库,使用的时候还得安装,小伙伴们需要记得。笔者使用的是PyCharm,需要安装新的模块的时候可以使用pip,也可以这样操作:点击这里,看到有设置选项,点进去:然后就可以看到自己已经安装的了模块,看右上角有一个 ‘+’ 的符号,这是添加,‘-’ 是删除,我们点
原创
发布博客 2020.11.11 ·
1161 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

使用python爬虫,requests(夹带BeautifulSoup的使用)爬取网络小说

使用python爬虫,requests(夹带BeautifulSoup的使用)爬取网络小说由于本人也是初学者,算是小白一枚,这里跟大家分享一下爬取网站上的小说的过程。第一步我们需要导入我们需要的模块,比如requests,BeautifulSoup,还有正则模块re。import reimport requestsfrom bs4 import BeautifulSoup然后我们需要找到我们需要爬取的网站,这里我选用了这个网站:*http://www.tianxiabachang.cn接
原创
发布博客 2020.11.06 ·
630 阅读 ·
2 点赞 ·
2 评论 ·
4 收藏