思路:
python上手最快的是爬虫,也最有成就感,所以本教程教程从爬虫开始,逐步补充个各个部分的知识。
正常的学习爬虫的路线:爬整个网页~爬网页中的指定文字(比如新闻的正文)~爬网页中的一个图片~爬网页中的多个图片~爬多个网页的多个文字和图片~爬网页中的视频~爬有反爬的无验证码和登陆的普通网站~爬有反爬的且需要登陆验证码的网站(比如淘宝)~从有反爬技术的网站爬取大量数据
主线
第一期
- 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :http://tieba.baidu.com/p/2166231880
- 参考资料:https://cuiqingcai.com/1052.html
第二期
有两个小题:
1)实现一个程序,用cmd运行后会有〉〉〉这样的输入框,输入城市名的拼音/名字,可以自动显示近3天的天气;
2):在上个题的基础上,实现一个微信机器人,发送城市名后可以自动回复近3天的天气;(第三方库: GitHub - littlecodersh/ItChat: A complete and graceful API for Wechat. 微信个人号接口、微信机器人及命令行微信,三十行即可自定义个人号机器人。)
第三期
- 把https://pan.baidu.com/s/14QtBWFXhCmrM1OHtvaxF-Q这个云盘地址的课程目录用爬虫爬取下来,组合成dict+list格式;
- 把目录转化为树形结构,参考:https://github.com/jml/tree-format
- 附加题:把树形结构尝试生成一张图片保存下来;
第四期
- 尝试在命令行输入
curl aoaoao.me:1926
查看效果(若提示curl命令不存在请自行安装,windows下安装完整版的cmder自带各种常用命令) - 尝试做出这种效果的图片
- 尝试做出这种效果的视频或者动图(加分题)
支线
算法题也比较考验思维能力,挑战自己的智商边界,直接做在线题库即可:
http://lintcode.com/problem/