2021SC@SDUSC
计划采取的是java的gecco爬虫框架开发,但考虑到java语言对于爬虫的支持不如python的全面,以及在数据分析层面上python语言的充分支持,还是考虑采用python的scarpy爬虫对数据进行抓取。
安装scrapy时,(windows系统,python3.9)采用pip install scarpy 命令
报错1:10061由于目标计算机积极拒绝,无法连接
大概率是使用了网络代理所致
在浏览器(以chrome为例)设置里找到代理
打开
关闭使用代理服务器
pip安装报错的问题解决
错误2:安装scrapy报超时错误
解决:pip安装采用清华镜像
pip install -i https: