2017年03月_未济2019

12月 11月 10月 09月 07月 06月 05月 04月 03月 02月 01月

原创 [bigdata-57] redis集群方案+监控+内存复制

1. redis在3.0之前只支持单实例，内存可以到100G~1T级别。2. 在没有集群之前，各家的解决方案是，把数据分片sharding存储在多个redis实例，每个片是一个redis实例。3. 集群方案1--客户端分片 3.1 分片逻辑在redis客户端实现。redis客户端按照预先定义好的路由规则，把对key的访问转发到不同的redis实例，最后把返回结果汇集。

2017-03-28 20:52:39 545

原创 [bigdata-56] py3+selenium 抓取学信网最简demo

各种情况不考虑，只演示核心功能。#!/usr/bin/env python3# !-*- coding:utf-8 -*-"""演示如何抓取学信网"""import timefrom selenium import webdriverdef get_sub_regions(browser, url): #登录页面 browser.get(url)

2017-03-22 14:51:13 1224

原创 [bigdata-55] python3 操作redis

1. 安装pip3 install redis2. 测试连接#!/usr/bin/env python3#! -*- coding:utf-8 -*-import redisr = redis.StrictRedis(host='192.168.1.xxx', port=63790, db=0, password='z88')ret = r.set('foo', '

2017-03-17 19:30:43 864

原创 [bigdata054] python3 urllib的timeout测试

#!/usr/bin/env python3#! -*- coding:utf-8 -*-import timeimport urllib# requestimport urllib.requestdef test_request_get(): #要打开的url # url = 'http://www.sohuuuu.com' # url = 'http:

2017-03-16 16:05:21 1824

原创 [bigdata-053] flask开发和高并发部署

Flask的web server，可以以python3 myflask.py的方式运行，但这种方式不能用于生产环境，不稳定，比如说，每隔十几分钟，有一定概率遇到连接超时无返回的情况。有各种方式部署。比较简单的方式，就是用gevent部署。1. pip3 install gevent2. myflask.py如下#!/usr/bin/env python3#! -*

2017-03-15 20:35:28 18324

原创开发语录

1. 如果在计算里有除法，比如a/b，一定要判断b是否为零，任何情况下。如果将str转化成int，一定要判断异常，因为str可能是''或者各种字符串，转化不成功。2. 如果要存储到一个文件，比如检查文件是否存在，任何情况下。3. 不要信任别人传过来的参数，一定要检查，检查格式，检查内容，检查是否空，任何情况下。4. 在量大的情况下，小概率事件，一定会发生，不可能发生的事情，一定会发生，...

2017-03-14 16:15:41 786

原创 [bigdata-052]在centos7上配置一个https主机

在centos 7 上配置一个https主机1. 登录 ssh root@121.41.xxx.xxx2. 安装opensslyum install opensslyum install openssl-devel.x86_643. 安装nginx3.1 参考文档https://my.oschina.net/liucao/blog/4702

2017-03-04 20:26:56 465

原创 [bigdata-51] 一个高并发的 web 爬取状态更新系统

2017-03-01 19:00:46 689

评分卡模型理论推导-草稿

评分卡模型理论推导，草稿版。

2018-12-20

史上最直白的lda教程

史上最直白的lda教程的pdf文档，0积分下载。求rp。

2015-12-16

史上最直白的pca教程

史上最直白的pca教程，整理文档，一个完整的pdf文件。

2015-11-27

史上最直白的logistic regression教程整理稿

史上最直白的logistic regression教程整理稿。讲4篇博文整理成一个完整的pdf文档。且修改成学术语境。

2015-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人