自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

fuyao2209的博客

原创 python爬虫爬取小说

文章目录1.请求服务器1.1分析网页2获取第一章内容2.1获取html文件2.2解码2.3提取并保存信息2.4写入txt3.爬取首页所有链接3.1封装函数的方法3.2爬取首页所有链接4、爬取所有章节1.请求服务器1.1分析网页请求服务器之前要先看一下这个网页的构造，我们可以看到它的信息全部都是通过html加载出来的，一个url 对应一个章节，所以我们只需要提取到该小说目录的所有链接就可以...

2020-04-19 22:27:12 4310 4

原创电影信息爬取

文章目录1.抓包分析1.1 网页分析1.2如何进行抓包2.电影信息爬取2.1爬取第一页2.1.1请求网页2.1.2获取text内容:2.1.3获取json内容：2.1.4xpath提取内容2.2爬取2020所有电影信息3将爬取内容写入CSV文件4.代码汇总1.抓包分析网址：电影票房1.1 网页分析在爬取网页内容之前，第一件事就是分析它的网页数据的加载方式，再决定我请求服务器的方式。我们点...

2020-04-19 21:13:13 1935

原创 Python爬虫之豆瓣TOP250爬取

@1.

2020-04-10 22:41:00 3821

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

あ许�babyざ

博客等级

码龄7年

3
原创

14
点赞

139
收藏

10
粉丝

关注

私信

热门文章

最新评论

python爬虫爬取小说
u010326852: 因为你爬取出来的小说存放地址不对，c盘的users那个路径下没有元尊这个文件夹，你可以换一个盘，改一下路径就可以了
python爬虫爬取小说
八万喷子总教头: 为什么我在控制台输出是一整行很长很长的
python爬虫爬取小说
WS Mok: FileNotFoundError Traceback (most recent call last) <ipython-input-1-ea4672d955f7> in <module> 41 target_url = link 42 print ("正在在爬取：", target_url) ---> 43 download_text(target_url) #带进去的东西 <ipython-input-1-ea4672d955f7> in download_text(url) 20 text = "".join(content) # 把数组转换为字符串，\r和\n都是换行符 21 # 保存到txt文件，放到电脑桌面，绝对路径,r表示原意，\代表转义字符 ---> 22 with open(filePath + title[0] + '.txt', 'a', encoding='utf-8') as file: #创建并打开一个文件 23 file.write(text) #放进去内容，写入 24 file.close() # 关闭 FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\asus\\元尊\\\\完本感言.txt' 运行时出现这情况，请问原因？谢谢。
python爬虫爬取小说
叶幕江宁: 这么好的文章，问什么没评论呢？建议全文背诵

提示

确定要删除当前文章？

取消删除