自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 python logging 日志名称以及切割处理

python logging 日志名称以及切割处理按照日期切割日志:默认生成的日志文件格式是你的文件名+时间的格式,没有设置时间的话默认设置到了秒(这里是按秒切割)import loggingfrom logging.handlers import TimedRotatingFileHandler from logging.handlers import RotatingFileHandlerimport osimport sysfrom datetime import datetime

2021-01-08 17:42:07 909

原创 03_d3-回归与非监督学习概述

03_d3-回归与非监督学习概述知识架构1. 回归问题线性模型试图学得一个通过属性的线性组合来进行预测的函数:![image.png](https://img-blog.csdnimg.cn/img_convert/bf18a0744299fcd5ab278809aa126253.png#align=left&display=inline&height=64&margin=[object Object]&name=image.png&origin

2020-12-10 10:45:12 393

原创 02_d2-分类算法概述

02_d2-分类算法概述知识架构### 1.数据集机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效API: sklearn.model_selection.train_test_splitscikit-learn数据集API介绍sklearn.datasets加载获取流行数据集datasets.load_*()获取小规模数据集,数据包含在datasets里datasets.fetch_*(data_ho

2020-12-10 10:44:02 1126

原创 01_d1-机器学习与特征工程概述

01_d1-机器学习与特征工程概述知识框架### 1. 数据类型数据类型离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度。连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续的,如,长度、时间、质量值等,这类整数通常是非整数,含有小数部分。注:只要记住一点,离散型是区间内不可分,连续型是区间内可分离散型数据:分类问题连续型数据:回归问题(线性回归)常用数据集数据的

2020-12-10 10:43:02 179

原创 数据结构与算法(Python)简析

1.数据结构与算法(Python)1.引⼊概念引⼊先来看⼀道题:如果 a+b+c=1000,且 a2+b2=c^2(a,b,c为⾃然数),如何求出所有 a、b、c可能的组合?1.第⼀次尝试import timestart_time = time.time()# 注意是三重循环for a in range(0, 1001): for b in range(0, 1001): for c in range(0, 1001): if a**2 + b**2 == c**2 a

2020-12-10 10:36:54 805

原创 1.matplotlib简单使用

1.matplotlib1. matplotlib基本要点In [193]: from matplotlib import pyplot as pltIn [194]: x = range(2, 26, 2) # 数据在x轴是一个可迭代对象In [195]: xOut[195]: range(2, 26, 2)In [196]: y = [15, 13, 14.5, 17,20,25,26,26,24,22,18,15]# 数据在y轴的位置是一个可迭代对象# x轴和y轴的数据组成了所有

2020-12-09 18:43:54 266 1

原创 3.pandas简单使用

3.pandaspandas的常用数据类型Series 一维,带标签数组DataFrame 二维,Series容器pandas 显示所有行列pd.set_option('display.max_columns', None)#显示所有行pd.set_option('display.max_rows', None)pandas之读取外部数据我们的这组数据存在csv中,我们直接使用pd. read_csv即可和我们想象的有些差别,我们以为他会是一个Series类型,但是他是一个Dat

2020-12-09 18:41:15 229

原创 2.numpy矩阵简单使用

2.numpy矩阵numpy创建数组(矩阵)创建数组# 创建数组a = np.array([i for i in range(1, 6)])b = np.array(range(1, 6))c = np.arange(1, 6)# a = b = c# arange([start,] stop[, step,], dtype=None)print(a, b, c)# 数组的类名print(type(a))# 数组的类型print(a.dtype)数据类型的操作# 数据

2020-12-09 18:38:24 385

原创 celery+rabbitmq

Rabbitmq使用# 设置RabbitMQ:创建一个用户,一个虚拟主机并设置权限,(需要先启动服务)sudo rabbitmqctl add_user myuser mypasswordsudo rabbitmqctl add_vhost myvhost # 虚拟主机sudo rabbitmqctl set_user_tags myuser mytag # administrat...

2020-04-24 10:54:19 238 2

转载 linux 更新yum源 改成阿里云源

1、备份mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup2、下载新的CentOS-Base.repo 到/etc/yum.repos.d/CentOS 5wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.al...

2019-05-28 18:03:16 437

翻译 安装yum和pyhton

Centos7自带了Python,Centos7.3的版本是2.7.5。在大多数情况下,这个版本的Python都是能很好满足你的需求的。然鹅,我们很多时候需要使用3.x版本,比如TensorFlow最新版就需要Python3.5。如果你一时鸡冻,直接卸载了Python2.7.5装了个3.X版本的Python。呵呵,别得意的太早,我要恭喜你就摊上大事了,yum不能用了。因为可爱的yum是依赖Pyth...

2019-05-28 17:58:36 723

转载 linux下解压rar文件

linux下解压rar文件二、下载并安装rar软件2.1 下载mkdir -p /home/oldboy/toolscd /home/oldboy/toolswget http://www.rarlab.com/rar/rarlinux-3.8.0.tar.gz2.2 安装tar zxvf rarlinux-3.8.0.tar.gzcd rarmakemake inst...

2019-05-27 17:01:09 141

转载 windows 自动化测试

http://www.cnblogs.com/Anec/p/10370401.html

2019-04-28 09:07:02 619

转载 定时任务

https://www.cnblogs.com/1a2a/p/8903613.htmlhttps://www.cnblogs.com/lizm166/p/8169028.htmlhttps://www.cnblogs.com/xd502djj/p/4292781.html

2019-04-20 16:05:00 133

翻译 docker 创建部署redis集群

基于Docker的redis集群搭建Redis集群官方介绍:http://www.redis.cn/topics/cluster-tutorial.html基于Docker搭建Redis集群环境:6个节点,三主三从制作Redis镜像:docker build -f dockerfile -t jiang/redis-cluster:4.0.1 .dockerfile文件:...

2019-03-13 15:21:58 1495

原创 docker 打包本地镜像,并到其他机器进行恢复

使用docker images查看本机所有的镜像文件 docker save eb40dcf64078> /root/mydjango-save-1016.tar 将镜像保存为本地文件,其中eb40dcf64078为image id 将保存到本地的文件上传到不能pull的服务器上,网络是相通的我这里直接使用的是scp命令 使用load方法...

2019-03-13 15:18:49 15669 1

原创 mysql8.0遇到的一个坑(group by 分组 sql语句的用法)

使用 sql 查询时 mysql 报如下错误,完整报错如下:ERROR 1055 (42000): Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'spider_rule.link_parameter.id' which is not functionally...

2019-03-11 14:48:44 6108

原创 xpath 过滤指定标签

//div/*[not(name='h3')]/text()

2019-01-09 16:44:28 6219 3

转载 Git分支本地操作详解

http://www.cnblogs.com/videring/articles/6962005.html

2019-01-09 09:02:49 135

转载 Python 操作redis

https://www.cnblogs.com/zhaohuhu/p/9140673.html#_label2_9

2019-01-09 09:01:57 99

转载 DevOps简介

https://www.cnblogs.com/liufei1983/p/7152013.html

2019-01-09 09:00:44 222

转载 git 使用

一、为什么  为什么不用svn?svn是一个优秀的代码和版本管理工具,使用svn只需要搭建好svn中央仓库,配置本地svn客户端即可,自从google code关闭服务之后,互联网上已经没有非常好的公共svn仓库,如果是公司内部使用,还可以用上公司内网搭建的svn服务器,但个人就没那么方便了。  为什么用git?git和svn同样作为代码和版本管理工具,git的理念更先进,而且公共...

2019-01-09 08:59:38 103

转载 mysql 自动启动

1、将服务文件拷贝到init.d下,并重命名为mysqlcp /usr/local/mysql/support-files/mysql.server /etc/init.d/mysqld2、赋予可执行权限chmod +x /etc/init.d/mysqld3、添加服务chkconfig --add mysqld4、显示服务列表chkconfig --list...

2019-01-09 08:58:19 474

转载 mongo 可视化

最近想自己搭建一个个人博客,所以学了下mongodb,mongodb是用命令行输入的,有些人可能不太习惯,我自己找了下mongodb的一些可视化工具,发现了一款adminmongo很好用,这里介绍给你们用一下。 github地址:https://github.com/mrvautin/adminMongo安装方法:1、把git仓库克隆到本地git clone https:...

2019-01-09 08:55:50 126

转载 mongodb Python 聚合

python操作mongodb之二聚合查询 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 ...

2019-01-07 14:02:17 190

转载 xapth使用方法

xpath使用方法一、选取节点常用的路劲表达式:表达式 描述 实例   nodename 选取nodename节点的所有子节点 xpath(‘//div’) 选取了div节点的所有子节点 / 从根节点选取 xpath(‘/div’) 从根节点上选取div节点 // 选取所有的当前节点,不考虑他们的位置 xpat...

2018-12-10 10:29:12 768

原创 scrapy请求队列:

Scrapy 如何获取 request 队列?最近由于在数据量比较大的抓取遇到了一些问题,就想看看运行时的request队列中的url有什么,可是google的很久也没找到获取request队列的api,我查了这么久得出以下结论: 1.spider运行时的request由schedule控制 2.可以通过self.crawler.engine.schedule这种方式获取到schedule...

2018-11-28 10:41:30 3534

转载 kafka 外部机器连接不上由于防火墙问题

1、版本问题:在apache官网上,有两个kafka0.10的版本一个是scala2.11的一个是2.10的,据scala官网描述,scala2.11主要在jdk6以上使用,scala2.10在主要在java5上使用,所以我们可以根据自己机器的java环境来选择正确的kafka安装使用,在客户端方面,版本最好和服务器保持一直,以免出现不必要的麻烦。2、防火墙问题:首先确保kafak服务...

2018-11-26 17:47:03 2515

原创 python3.6 安装

Linux下安装Python3.6和第三方库如果本机安装了python2,尽量不要管他,使用python3运行python脚本就好,因为可能有程序依赖目前的python2环境,比如yum!!!!!不要动现有的python2环境!一、安装python3.61. 安装依赖环境  # yum -y install zlib-devel bzip2-devel openssl-de...

2018-11-22 16:44:17 128

转载 转载 twisted(1)--何为异步

https://www.cnblogs.com/skying555/p/5622500.html

2018-11-12 11:09:58 82

转载 charles 工具

https://www.cnblogs.com/xiaocainiao920/p/8073073.html

2018-10-21 12:31:22 168

原创 今日头条案例抓取

https://www.cnblogs.com/woshiruge/p/8449304.html

2018-10-20 12:05:56 1343

原创 Python脚本下载今日头条视频(附加Android版本辅助下载器)

主要是对js的理解和处理,将其转换成python,代码随后上传http://www.wjdiankong.cn/archives/944 

2018-10-20 11:38:41 633

转载 https://www.cnblogs.com/zccpython/p/6886634.html

https://www.cnblogs.com/zccpython/p/6886634.html

2018-09-30 14:27:51 209

原创 python图像识别处理

https://www.cnblogs.com/beer/p/5672678.html

2018-08-31 15:55:53 1249

转载 mysql启动

CentOS7.2安装mariadb-server,解决Failed to start mysqld.service: Unit not found当输入命令~]# systemctl start mysql.service要启动MySQL数据库是却是这样的提示Failed to start mysqld.service: Unit not found解决方法如下:  首先...

2018-07-23 09:13:27 124

转载 python中uncoide

# -*- coding: utf-8 -*-与sys.setdefaultencoding('utf-8') 是两个不同的概念。第一种:是指定当前程序文件的编码方式。即编译器在解析code是认为code是哪种编码方式。如果不像第一种那样指定,我们的程序中是不能以中文声明字符串的。第二种:是指定了python的unicode类型使用何种编码来存储unicode字符串。如果不声明

2018-01-19 22:28:51 458

转载 mysql数据库优化

MySQL数据库优化的八种方式引言:关于数据库优化,网上有不少资料和方法,但是不少质量参差不齐,有些总结的不够到位,内容冗杂偶尔发现了这篇文章,总结得很经典,文章流量也很大,所以拿到自己的总结文集中,积累优质文章,提升个人能力,希望对大家今后开发中也有帮助1、选取最适用的字段属性MySQL可以很好的支持大数据量的存取,但是一般说来,数据库

2017-12-31 09:43:04 291

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除