- 博客(3)
- 收藏
- 关注
原创 提高rabbitmq的File descriptors的total_limit和sockets_limit值
按默认配置安装完RabbitMQ后,发现其File descriptors(即文件描述符)和Socket descriptors都特别低,分别为924和829。客户端(消费者)保持长连接时很容易就将socket占满。 本人是用下面命令来启动rabbitmq服务 sytemctl start rabbitmq-server.service 因此先找到rabbitmq-server.servi...
2019-11-12 14:56:21 1083
原创 Hadoop初识
这篇博客主要给大家讲讲Hadoop是啥... Hadoop介绍 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 该架构主要用于开发分布式程序,主要适用于并行高速计算和分布式存储。 Hadoop发展历程 2004年,Google发表论文,向全世界介绍什么是MapReduce。 2005年,Nutch的开发者基于Google发布的MapReduce报告,在Nutch上开...
2019-08-01 16:40:01 75
原创 Python爬虫(selenium带你“投机取巧”)
最近刚接的任务,帮客户爬一个专利网的信息,具体需求如下: 首先注册账号,用账号密码从首页登录进来后,进入查询界面 这是一个分页显示,例如这个查询结果一共98页,每页有10条数据,每条专利信息点击进去爬取到如下四个字段的内容并写Excel中。 爬取难点: 1.登录界面的验证码跟普通验证码不同,难顶! 2.在使用selenium之前,自己用拼接url的方式解决了分页爬取,但...
2019-08-01 16:25:12 515
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人