自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (6)
  • 收藏
  • 关注

原创 [bigdata-57] redis集群方案+监控+内存复制

1. redis在3.0之前只支持单实例,内存可以到100G~1T级别。2. 在没有集群之前,各家的解决方案是,把数据分片sharding存储在多个redis实例,每个片是一个redis实例。3. 集群方案1--客户端分片    3.1 分片逻辑在redis客户端实现。redis客户端按照预先定义好的路由规则,把对key的访问转发到不同的redis实例,最后把返回结果汇集。

2017-03-28 20:52:39 545

原创 [bigdata-56] py3+selenium 抓取学信网 最简demo

各种情况不考虑,只演示核心功能。#!/usr/bin/env python3# !-*- coding:utf-8 -*-"""演示如何抓取学信网"""import timefrom selenium import webdriverdef get_sub_regions(browser, url): #登录页面 browser.get(url)

2017-03-22 14:51:13 1224

原创 [bigdata-55] python3 操作redis

1. 安装pip3 install redis2. 测试连接#!/usr/bin/env python3#! -*- coding:utf-8 -*-import redisr = redis.StrictRedis(host='192.168.1.xxx', port=63790, db=0, password='z88')ret = r.set('foo', '

2017-03-17 19:30:43 864

原创 [bigdata054] python3 urllib的timeout测试

#!/usr/bin/env python3#! -*- coding:utf-8 -*-import timeimport urllib# requestimport urllib.requestdef test_request_get(): #要打开的url # url = 'http://www.sohuuuu.com' # url = 'http:

2017-03-16 16:05:21 1824

原创 [bigdata-053] flask开发和高并发部署

Flask的web server,可以以python3 myflask.py的方式运行,但这种方式不能用于生产环境,不稳定,比如说,每隔十几分钟,有一定概率遇到连接超时无返回的情况。有各种方式部署。比较简单的方式,就是用gevent部署。1. pip3 install gevent2. myflask.py如下#!/usr/bin/env python3#! -*

2017-03-15 20:35:28 18324

原创 开发语录

1. 如果在计算里有除法,比如a/b,一定要判断b是否为零,任何情况下。如果将str转化成int,一定要判断异常,因为str可能是''或者各种字符串,转化不成功。2. 如果要存储到一个文件,比如检查文件是否存在,任何情况下。3. 不要信任别人传过来的参数,一定要检查,检查格式,检查内容,检查是否空,任何情况下。4. 在量大的情况下,小概率事件,一定会发生,不可能发生的事情,一定会发生,...

2017-03-14 16:15:41 786

原创 [bigdata-052]在centos7上配置一个https主机

在centos 7 上配置一个https主机1. 登录  ssh root@121.41.xxx.xxx2. 安装opensslyum install opensslyum install openssl-devel.x86_643. 安装nginx3.1 参考文档https://my.oschina.net/liucao/blog/4702

2017-03-04 20:26:56 465

原创 [bigdata-51] 一个高并发的 web 爬取 状态更新系统

2017-03-01 19:00:46 689

评分卡模型理论推导-草稿

评分卡模型理论推导,草稿版。

2018-12-20

史上最直白的lda教程

史上最直白的lda教程的pdf文档,0积分下载。求rp。

2015-12-16

史上最直白的pca教程

史上最直白的pca教程,整理文档,一个完整的pdf文件。

2015-11-27

史上最直白的logistic regression教程整理稿

史上最直白的logistic regression教程整理稿。讲4篇博文整理成一个完整的pdf文档。且修改成学术语境。

2015-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除