CentOS7安装Scrapy和一些爬虫会用到的服务

最新推荐文章于 2024-08-22 10:55:15 发布

MichaelScofield

最新推荐文章于 2024-08-22 10:55:15 发布

阅读量2.3k

点赞数 2

文章标签： centos python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/michaeljscofield/article/details/72236265

版权

博客链接 https://uublog.com/article/20170308/centos7-install-scrapy/
讯云这几天搞活动，免费领了三个月的免费VPS。所以想把本地虚拟机的scrapy爬虫迁移上去。

Scrapy是基于Python写的。本来是要安装Python的，但是现在Linux基本都默认安装到Python了，所以这步略过。

我本地是Ubuntu，服务器我装了CentOS7.2。别问我为啥不用Debian，我瞎选的，没啥特别理由。

自己私人使用，为了方便，直接是root开干。

安装pip包管理

yum install -y python-pip

配置pip安装源为阿里云 http://mirrors.aliyun.com/help/pypi。

我觉得这是天朝必备的一个步骤，否则安装软件那龟速不忍直视。

mkdir ~/.pip
vim ~/.pip/pip.conf

# 改为如下内容
[global]
index-url = http://mirrors.aliyun.com/pypi/simple/

[install]
trusted-host=mirrors.aliyun.com

3, 安装编译器和开发库之类的，假如你们也没安装的话

yum -y install gcc gcc-c++ kernel-devel python-devel libxslt-devel libffi-devel openssl-devel

安装主角Scrapy

pip install scrapy

安装MySQL-python

Python连接MySQL的模块

easy_install MySQL-python

如果遇到mysql_config not found
之前的博文有提过这个错误，不过是在Ubuntu下的解决方案-安装libmysqlclient-dev
然而在CentOS的源中并没有这个包。而安装mysql-devel即可。

yum install -y mysql-devel

安装MySQL数据库 yum groupinstall mariadb mariadb-client

MariaDB其实可以看做MySQL新版吧，具体缘由自行百度。

安装redisNoSQL数据库
会用到配合bloomfilter做url去重。

yum install -y redis

安装 BloomFilter 模块

pip install bloomfilter

至此就差不多了，目前我就用到这些，另外requests和beautifulsoup4模块也装一下。

MichaelScofield

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

MichaelScofield CSDN认证博客专家 CSDN认证企业博客

码龄12年

55: 原创

10万+: 周排名

2万+: 总排名

24万+: 访问

: 等级

3013: 积分

67: 粉丝

116: 获赞

36: 评论

118: 收藏

私信

关注

热门文章

分类专栏

最新评论

Kubernets Apiserver IP 段变更后的故障处理
全栈小5: 博主的文章总是深入浅出，让我不再觉得学习新知识困难。博主的付出和分享令人钦佩。谢谢你，继续前行！支持【Kubernets Apiserver IP 段变更后的故障处理，博主这篇文章，值得一看】
Kubernets Apiserver IP 段变更后的故障处理
CSDN-Ada助手: 网络技能树或许可以帮到你：https://edu.csdn.net/skill/network?utm_source=AI_act_network
Kubernets Apiserver IP 段变更后的故障处理
小王毕业啦: 您的这篇文章对于Kubernets Apiserver IP 段变更后的故障处理提供了非常有价值的信息，让我对这个主题有了全新的认识。您对细节的描写非常到位，展现了您深厚的专业功底。期待您未来能够持续分享更多这样有深度的好文，希望能够得到您的指导，与您共同进步。非常感谢您的分享和支持！
kubernetes日志收集 fluent-operator 动态索引名的实现
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
Delphi 快速读取TXT 指定行的数据
MichaelScofield: 脱离windows系统好多年了,delphi也不写好多年了,无法给到回答.

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。