项目笔记：中期报告

最新推荐文章于 2022-08-11 15:53:08 发布

mr_guo_lei

最新推荐文章于 2022-08-11 15:53:08 发布

阅读量1.1k

点赞数

分类专栏：心路历程-成长笔记 python笔记 mysql笔记中央财经大学文章标签：生活码农界面爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mr_guo_lei/article/details/78678248

版权

这篇博客记录了作者在大学生创业创新项目中的中期体验，主要负责Python爬虫和GUI界面设计。从urllib到selenium，详细讲述了爬虫技术的学习过程，以及使用tkinter进行GUI界面设计的心得。通过多线程解决了界面卡死问题，同时分享了尝试链接数据库的经历，表达了对技术学习的热情和对码农生活的反思。

摘要由CSDN通过智能技术生成

大学生创业创新项目，如今到了中期回报的阶段，感觉没有做什么，单干劲儿也做了很多

当初分配任务的时候，我是负责爬虫和tk界面的，不得不说我一个人揽了这两个活也不算少了，相比其他人也算可以得了吧

这么久了，学到的不少，单是大部分都是使用技能而不是我所想象的，真的不想成为一个码农，码奴，该觉那样的生活乏味而没有意义

那样的生活跟混吃等死又有什么区别呢？哎。

总结一下吧：

python爬虫的历程：

urllib->requests->selenium+chromedriver->selenium+phantomjs

期间也研究了一下scrapy但也是到了如今这段时间了，心里想考研，但却抵触政治，但是还是把爬虫这块的工作撂下了

urllib是最简洁最方便的，但是太容易被封了，反反爬虫技术：建立Opener使用代理ip，sleep，都是比较简单的反反爬虫，意义不大，但是效率很高

requests可以构造头部，可以传参数，可以代理ip，可以加载一部分动态页面，不得不说，是要比urllib好一些的

selenium + chromedriver第一次接触是为了模拟登录，获取cookie带cookie访问，不得不说，还是蛮好用的，当初是结合着requests用的，不久前的一段时间才发现可以获取page_source属性，来直接分析，那样作用大大提升

selenium + phantomjs当初遇到js加载的页面时候的焦头烂额

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。