项目笔记:中期报告

这篇博客记录了作者在大学生创业创新项目中的中期体验,主要负责Python爬虫和GUI界面设计。从urllib到selenium,详细讲述了爬虫技术的学习过程,以及使用tkinter进行GUI界面设计的心得。通过多线程解决了界面卡死问题,同时分享了尝试链接数据库的经历,表达了对技术学习的热情和对码农生活的反思。
摘要由CSDN通过智能技术生成

大学生创业创新项目,如今到了中期回报的阶段,感觉没有做什么,单干劲儿也做了很多

当初分配任务的时候,我是负责爬虫和tk界面的,不得不说我一个人揽了这两个活也不算少了,相比其他人也算可以得了吧

这么久了,学到的不少,单是大部分都是使用技能而不是我所想象的,真的不想成为一个码农,码奴,该觉那样的生活乏味而没有意义

那样的生活跟混吃等死又有什么区别呢?哎。

总结一下吧:

python爬虫的历程:

urllib->requests->selenium+chromedriver->selenium+phantomjs

期间也研究了一下scrapy但也是到了如今这段时间了,心里想考研,但却抵触政治,但是还是把爬虫这块的工作撂下了

urllib是最简洁最方便的,但是太容易被封了,反反爬虫技术:建立Opener使用代理ip,sleep,都是比较简单的反反爬虫,意义不大,但是效率很高

requests可以构造头部,可以传参数,可以代理ip,可以加载一部分动态页面,不得不说,是要比urllib好一些的

selenium + chromedriver第一次接触是为了模拟登录,获取cookie带cookie访问,不得不说,还是蛮好用的,当初是结合着requests用的,不久前的一段时间才发现可以获取page_source属性,来直接分析,那样作用大大提升

selenium + phantomjs当初遇到js加载的页面时候的焦头烂额

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值