项目笔记:中期报告

大学生创业创新项目,如今到了中期回报的阶段,感觉没有做什么,单干劲儿也做了很多

当初分配任务的时候,我是负责爬虫和tk界面的,不得不说我一个人揽了这两个活也不算少了,相比其他人也算可以得了吧

这么久了,学到的不少,单是大部分都是使用技能而不是我所想象的,真的不想成为一个码农,码奴,该觉那样的生活乏味而没有意义

那样的生活跟混吃等死又有什么区别呢?哎。

总结一下吧:

python爬虫的历程:

urllib->requests->selenium+chromedriver->selenium+phantomjs

期间也研究了一下scrapy但也是到了如今这段时间了,心里想考研,但却抵触政治,但是还是把爬虫这块的工作撂下了

urllib是最简洁最方便的,但是太容易被封了,反反爬虫技术:建立Opener使用代理ip,sleep,都是比较简单的反反爬虫,意义不大,但是效率很高

requests可以构造头部,可以传参数,可以代理ip,可以加载一部分动态页面,不得不说,是要比urllib好一些的

selenium + chromedriver第一次接触是为了模拟登录,获取cookie带cookie访问,不得不说,还是蛮好用的,当初是结合着requests用的,不久前的一段时间才发现可以获取page_source属性,来直接分析,那样作用大大提升

selenium + phantomjs当初遇到js加载的页面时候的焦头烂额

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值