2017年12月_木讷大叔爱运维

12月 11月 10月 09月 08月 05月 04月 03月 02月 01月

原创 scrapy爬虫之模拟登录豆瓣

简介在之前的博文python爬虫之模拟登陆csdn使用urllib、urllib2、cookielib及BeautifulSoup等基本模块实现了csdn的模拟登录，本文通过scrapy模拟登录豆瓣，来深入了解下scrapy。豆瓣登录需要输入图片验证码，我们的程序暂时不支持自动识别验证码，需要将图片下载到本地并打开以进行人工识别输入到程序中。分析豆瓣登录1.分析豆瓣登录页的样式

2017-12-28 12:29:22 7206 6

原创 scrapy爬虫之《琅琊榜2》话题title收集及词云展示

简介最近看微信公众号上好多文档关于豆瓣上电影的影评分析的，感觉挺有意思的，就拿《琅琊榜2》也来尝试下。本文主要是使用scrapy爬取豆瓣上的《琅琊榜2》的话题讨论区并用作词云展示。至于为什么使用scrapy，主要是之前使用过python的beautifulsoup、selenium等模块，各个功能都是自己写的，不是很系统，而scrapy作为爬虫框架内置css、xpath且异步抓取，效率很高。实现一、

2017-12-27 08:18:51 1570 1

原创 ansible-playbook实战之部署redis+sentinel+twemproxy

简介twemproxy，也叫nutcraker。是一个twtter开源的一个redis 和memcache 快速/轻量级代理服务器；Twemproxy是一个快速的单线程代理程序，支持Memcached ASCII协议和更新的Redis协议 Twemproxy 通过引入一个代理层，可以将其后端的多台 Redis 或 Memcached 实例进行统一管理与分配，使应用程序只需要在 Twemproxy

2017-12-21 17:52:45 2313

Huawei_iBMC.zip

Zabbix监控模板，用于zabbix通过iBMC监控华为服务器的硬件状态。iBMC系统默认支持V3版本的SNMP服务，SNMP V1和SNMP V2C由于自身机制存在安全隐患，默认是不开启的。

2020-11-12

pacemaker on centos7

centos7上配置pacemaker+corosync+drbd主从/双主

2016-01-27

apache内存计算

此脚本可以计算出当前httpd进程的个数和占用内存，来为我们配置apache工作模式提供参考

2015-12-03

svn源码泄露漏洞工具

在使用SVN管理本地代码过程中，会自动生成一个名为.svn的隐藏文件夹，其中包含重要的源代码信息。但一些网站管理员在发布代码时，不愿意使用‘导出’功能，而是直接复制代码文件夹到WEB服务器上，这就使.svn隐藏文件夹被暴露于外网环境，黑客可以借助其中包含的用于版本信息追踪的‘entries’文件，逐步摸清站点结构。

2015-08-28

Remote Desktop Organizer

win8版本下的远程桌面管理工具，最好用的管理远程桌面工具

2015-08-28

msvcr90.dll

py2exe打包的程序需要9.0.21022.8这个版本的MSVCR90.DLL，否则将打包后的程序发布到其他windows服务器上后无法运行

2015-08-28

check_logfiles

日志监控插件，结合nagios能够很好的实现日志监控

2015-05-18

magent-0.5.tar.gz

如果大家在google上下载不到，可以在这里下载magent 0.5稳定版

2015-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人