- 博客(2)
- 资源 (10)
- 收藏
- 关注
原创 使用爬虫进行一次 hexo 构建的博客爬取并且生成 md 文档
起因由于以前的博客文章在电脑重装的时候全没了,直接 cv 战士难免太过麻烦,正好好久没有写 python 了,于是决定写一个爬虫来爬取文章并且生成 md 文档分析使用的技术和库这里使用 python + BeautifulSoup4(网页装载与解析) + urllib(发起请求) + codecs(写入文件)主页我们来看看主页,一篇文章的位置 再来看看所有文章是怎么分布的 这简直就是最简单的
2017-12-03 20:57:56 1455
原创 Python3 爬虫--公司代理问题解决
废话好久没有造过轮子了,突发奇想解决一下一进公司写爬虫就遇到的代理的问题正文如果没有代理问题,如下代码就可以获取到网页 html 源码import urllibimport urllib.requestfrom bs4 import BeautifulSoupurl = "http://wintersmilesb101.online/"user_agent = 'Mozilla/4.0 (com
2017-12-02 14:41:55 4001
Docker —— 从入门到实践 epub
2017-12-06
廖雪峰的Python3x教程
2017-04-06
viewPager+Tablayout实现图片轮播
2016-11-10
仿网易云音乐播放控制面板实现(Service+UI绑定)
2016-10-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人