自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 资源 (1)
  • 收藏
  • 关注

原创 django和flask以WSGI的形式部署在windows

windows 下安装不了uwsgi 替代解决方案

2023-07-12 18:13:03 1003

原创 django model创建存储过程并执行

django存储过程的创建和使用

2023-04-25 14:04:50 577

转载 sigmoid函数的数学公式推导

Sigmoid函数的详细公式推导

2022-12-08 11:13:46 326

原创 谷歌浏览器 无法翻译此网页的解决方法(windows/mac)

谷歌浏览器(windows/mac)无法翻译此网页的解决方法

2022-10-09 15:55:09 4324

原创 小学生都能看懂的方向导数

方向导数基础运算

2022-07-14 16:19:56 123

转载 Bagging和Boosting的概念与区别

随机森林属于集成学习(ensemble learning)中的bagging算法,在集成算法中主要分为bagging算法与boosting算法,Bagging算法(套袋法)bagging的算法过程如下:从原始样本集中使用Bootstraping 方法随机抽取n个训练样本,共进行k轮抽取,得到k个训练集(k个训练集之间相互独立,元素可以有重复)。对于n个训练集,我们训练k个模型,(这个模型可根据具体的情况而定,可以是决策树,knn等)对于分类问题:由投票表决产生的分类结果;对于回归问题,由k个模型预

2022-03-31 13:53:58 124

原创 django跨库操作

一、在settings.py配置多个数据库DATABASES = { 'default1': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'choice', 'USER': 'ad_user', 'PASSWORD': 'ad_pass', 'HOST': '127.0.0.1', 'PORT': '3306', 'SIZE': '1

2021-12-09 17:50:51 911

原创 特征值分解以及python计算

奇异值的公式如下:直观上看就是把一个矩阵分成了三个矩阵。等号左边是原矩阵,等号右边是分解后的三个矩阵大多数人基本上看到这里就会懵逼了,what???能不能写成人能看懂的现在我就解释一下等号右边的公式是啥?首先已知原矩阵为AU就等于A的特征向量Σ就等于A的特征值的对角化V*就等于A的特征向量的逆python计算import numpy as npA=np.array([[4,2],[1,5]])print("*"*30)print("原始矩阵")print(A)vex=

2021-09-18 15:32:39 695

转载 uwsgi异常服务器内存cpu爆满优化思路

记录线上服务器通过linux性能检测工具glances检测到 cpu、内存爆满,且是uwsgi进程占用,对于服务器内核,以及uwsgi配置优化参考文章解决思路:1.修改内核配置2.修改uwsgi配置内核修改#对于一个经常处理新连接的高负载 web服务环境来说,默认的 128 太小了net.core.somaxconn = 262144​#表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数net.ipv4.tcp_max_syn_backlog

2021-09-18 11:21:09 1883

转载 统计学习--三种常见的相关系数以及python计算

统计学习–相关系数及其适用范围1)Pearson积差相关系数:用于量度两个变量X和Y之间的线性相关。它具有+1和-1之间的值,其中1是总正线性相关性,0是非线性相关性,并且-1是总负线性相关性。Pearson相关系数的一个关键数学特性是它在两个变量的位置和尺度的单独变化下是不变的。也就是说,我们可以将X变换为a+bX并将Y变换为c+dY,而不改变相关系数,其中a,b,c和d是常数,b,d > 0。请注意,更一般的线性变换确实会改变相关性。Pearson积差相关系数对应的计算公式如下:积差相关系

2021-09-14 10:29:53 2736

原创 rust hashmap的增删改查(类似python dict)

use std::collections::HashMap;// 声明let mut come_from = HashMap::new();// 插入come_from.insert("WaySLOG", "HeBei");come_from.insert("Marisa", "U.S.");come_from.insert("Mike", "HuoGuo");// 查找keyif !come_from.contains_key("elton") { println!("Oh,

2021-08-11 11:27:28 486

原创 rust 字符串与数字类型转换

let int_value = 5;//整型转字符串let string_value = int_value.to_string();//字符串转32位有符号整型let back_int = string_value.parse::<i32>().unwrap();// 字符串转32位无符号整型let back_int = string_value.parse::<u32>().unwrap();//字符串转16位有符号整型let back_int = str.

2021-08-10 16:20:27 6321

原创 特征值和特征向量手动计算

python计算特征值和特征向量

2021-08-05 15:37:08 315

原创 第四节 Pandas新增行或列

1.新增行:a.loc[5]=[1,1,1,1,1,1] #在行中新增为索引为5的数据其中数组中元素的个数需要和列的个数相同2.新增列a["穿衣指数"]=[1,1,1,1,1]其中数组中元素的个数需要和行的个数相同

2021-06-30 16:40:10 179

原创 第三节 Pandas几种查询方式

读取表格import pandas as pddf=pd.read_excel(r"/Users/a123/Desktop/气温.xlsx")print(df)在数据量特别大的时候回导致数据看不全,所有我们需要对截取数据的一部分1.查看头部(前三行)print(df.head(3))2.查看尾部(后三行)print(df.tail(3))3.取指定行(第0行)print(a.iloc[0])4.取指定列(“风力”列)print(a["风力])5.条件筛选:单条

2021-06-29 13:40:53 216 2

原创 第二节 Pandas中的Dataframe和Series

Dataframe是pandas中的数据结构,可以认为是一个表格数据import pandas as pd #导入pandas包df=pd.read_excel(r"C:\Users\Administrator\Desktop\测试.xlsx") #将文件的路径放入函数里面即可print(df) #打印对象1.每列可以是不同的值类型(数值、字符串、布尔值、日期等)2.既有行索引index(上图中的0),也有列索引columns(上图中的“第一列”,“第二列”)3.可以被看做由数组(列表)组

2021-06-28 11:25:43 112

原创 git pull 出现 error: pack-objects died of signal 9

大部分是由于git服务器内存不足无法对文件进行压缩也和解压导致。2中解决方案:1.自有git服务器 :增加虚拟内存 (挂在虚拟内存文件用完可以卸载)参考2. 清除git上面过大的文件

2021-06-26 17:04:42 2919

原创 pandas替换空值为任意值(包括None)

pandas 列对象和行对象在转换成json的时候很容易出现抓换错误,所有针对这个现象需要手动转换def pro_data(ret,target): if target is None: return ret.where(ret.notnull(), None).tolist() else: ret.fillna(target)

2021-06-22 16:52:57 2358

原创 pandas从内存(文档流)中读取数据

pandas 读取文档流with open("/Users/a123/Desktop/1.xlsx",'rb') as f: res= io.BytesIO(f.read())pd.read_excel(res)

2021-06-22 16:45:23 1265

原创 第一节 pandas将数据读取到内存中

pandas 的工作机制pandas是一个python扩展包那么他必然要将数据读取到python中来,那么可以识别哪些类型的数据格式呢?excel格式:xlsx,xls,csv对象格式:json查询集格式:sql网页格式:html这些格式是如何进行读取工作呢?import pandas as pd #导入pandas包df=pd.read_excel(r"C:\Users\Administrator\Desktop\测试.xlsx") #将文件的路径放入函数里面即可print(df)

2021-06-12 14:34:28 536 2

原创 pandas前言

什么是pandas?一个Python库:用于数据分析、数据处理、数据可视化,狭义上可以认为他是一个类似excel的工具.为什么要用pandas?大数据时代下数据量急剧上升excel已经无法满足这么庞大的数据了 (excel最多1048576行),pandas能够更好的代替excel完成复杂的工具.怎样使用pandas?第一种是小白使用的方式:在清华源中下载符合您系统的版本:清华源另一种是已经在本地有安装过python的可以直接使用:pip install pandas...

2021-06-12 13:22:07 213 2

原创 类时间文本转换成datetime类型(python)

def time_conversion(sj, dayfirst=False, yearfirst=True, fuzzy_with_tokens=True, return_month=False): """ sj: 要转换的时间字符串; dayfirst: 将不明确的3整数日期(例如01/05/09)中的第一个值解释为日(True)或月(False)。如果 yearfirst设置为True,则可以区分YDM和YMD yearfirst: 否将模棱两可的3整数日期(例如01/

2021-02-26 13:19:08 412

原创 python(mysqlclient包)链接mysql8.0时出现 OSError: mysql_config not found

一般这种情况是由于mysqlclient包与mysql客户端的版本不一致造成的,一般mysqlclient默认装的1.4.6这个版本并不适配mysql8.0,所以需要手动指定版本号,使用2以上的就可以了 pip install mysqlclient==2如果不想折腾可以直接用pymysql...

2021-02-26 13:12:29 451

原创 初中生都能看懂的(朴素)贝叶斯推导

基础部分原理部分

2020-09-04 11:19:29 118

原创 初中生都能看懂的感知机推导

2020-09-03 10:23:28 77

原创 高中生都能理解的BP神经网络推导

本来计划是写小学生都能理解的,但是奈何水平有限,没办法把高数的东西简化成小学生能理解的,以后有精力把门槛再降低到初中生、甚至小学生。

2020-08-11 17:51:25 145

原创 小学生都能看懂的sigmoid 求导

2020-08-11 13:39:20 92

原创 python计算特征根以及特征向量

特征根:特征根法也可用于通过数列的递推公式(即差分方程,必须为线性)求通项公式,其本质与微分方程相同。称为二阶齐次线性差分方程: 加权的特征方程。特征向量:A为n阶矩阵,若数λ和n维非0列向量x满足Ax=λx,那么数λ称为A的特征值,x称为A的对应于特征值λ的特征向量。式Ax=λx也可写成( A-λE)x=0,并且|λE-A|叫做A 的特征多项式。当特征多项式等于0的时候,称为A的特征方程,特征方程是一个齐次线性方程组,求解特征值的过程其实就是求解特征方程的解。令|A-λE|=0,求出λ值。

2020-08-11 09:30:53 4008

转载 scipy求最优解(参数优化)

scipy数值优化其实使用scipy进行数值优化,就是黑盒优化, 我们不依赖于我们优化的函数的算术表达式。注意这个表达式通常可以用于高效的、非黑盒优化。scipy中的optimize子包中提供了常用的最优化算法函数实现。我们可以直接调用这些函数完成我们的优化问题。optimize中函数最典型的特点就是能够从函数名称上看出是使用了什么算法。下面optimize包中函数的概览:1.非线性最优化fmin – 简单Nelder-Mead算法fmin_powell – 改进型Powell法fmin_bf

2020-07-27 09:11:19 1622

原创 时间序列之holt-winters(三次指数平滑)

# import needed packages#-----------------------import mathimport numpy as npimport pandas as pdfrom sklearn import linear_modelfrom scipy.optimize import fmin_l_bfgs_b# bring in the passenger data from HW4 to test the function against R

2020-07-24 11:18:14 788

转载 Python --深入浅出Apriori关联分析算法(一)

在美国有这样一家奇怪的超市,它将啤酒与尿布这样两个奇怪的东西放在一起进行销售,并且最终让啤酒与尿布这两个看起来没有关联的东西的销量双双增加。这家超市的名字叫做沃尔玛。你会不会觉得有些不可思议?虽然事后证明这个案例确实有根据,美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。但这毕竟是事后分析,我们更应该关注的,是在这样的场景下,如何找出物品之间的关联规则。接下来就来介绍下如何使用Apriori算法,来找到物品之间的关联规则吧。一. Apriori关联分析概述

2020-06-30 13:28:31 222

转载 ubuntu 下面 uwsgi: error while loading shared libraries: libpcre.so.1

在ubuntu下部署Django服务,使用uwsgi时报错命令:uwsgi --http :8001 --wsgi-file test.py报错信息:uwsgi: error while loading shared libraries: libpcre.so.1: cannot open shared object file: No such file or directory解决方式:sudo apt-get install libpcre3 libpcre3-dev # 安装需要的包find

2020-06-08 08:51:10 934 1

原创 机器学习数据预处理之字符串转数字

在机器学习中有很多特征有可能是字符串类型的:如周志华老师的西瓜书中西瓜的色泽、纹理、根茎等等。计算机对字符串的特征是无能为力的,所以将字符串特征映射成数字就成了一个唯一的选择。目前有2种主流的方法,一种是:标签编码(Label Encoder),另一种是独热编码(One Hot Encoder)。推荐使用独热编码。标签编码:标签编码就是对字符串转换成1 , 2,3这种形式,但是存在一个问题,就是标签编码的结果存在大小的关系,所以这种编码显然是有一定的局限性。#python实现from skl

2020-06-03 10:12:53 8550

原创 方差、协方差以及协方差矩阵

方差:是用来反应数据离散程度理论公式:例 95 85 75 65 55 45 的方差均值E(x)=(95+ 85+ 75+ 65+ 55+ 45)/6=70 n=6(总体个数)实际工作中,总体均数难以得到时,应用样本统计量代替总体参数,经校正后,样本方差计算公式:S^2= ∑(X-Xi ) ^2 / (n-1) 所以n需要减1 ,Xi是x的均值。协方差: 用于反映两个维度之间的数据偏离期望值的相关性公式:当 Cov(X, Y)>0时,表明 X与Y 正相关;当 C

2020-06-02 14:20:48 558

原创 贝叶斯定理笔记

假设:a是事件1发生的概率,b是事件2发生的概率ab同时发生的概率是:p(a)*p(b) 联合概率根据交换律可得:p(a)*p(b)=p(b)*p(a)=p(a and b)=p(b and a)对a、b进行展开p(a and b)=p(a)*p(b|a) p(b|a) 是a发生时b发生的概率 p(b and a)=p(b)*p(a|b) p(a|b) 是b发生时a发生的概率根据等号两边相同法则p(a)*p...

2020-06-01 16:36:21 805

原创 pandas 获取指定列中的某个值(范围)所属的行

#获取creativeID列中等于1000的行df[df['creativeID']==10000]#获取creativeID列中小于等于1000的行df[df['creativeID']<=10000]

2020-05-18 10:01:54 16783

原创 statsmodel回归结果的提取

x = np.array(2 * np.random.randn(20, 4) + 3)y = np.array([[1] * 10 + [0] * 5 + [2] * 5]).T#x和y需要都是npimport statsmodels.api as sm# 模型训练model = sm.OLS(endog=y, exog=sm.add_constant(x)).fit()# 查看模型结果model = model.summary()提取元素-回归系数类提取回归系数model.para

2020-05-15 08:54:02 2586 1

转载 准确率、精确率、召回率

假设我们手上有60个正样本,40个负样本,我们要找出所有的正样本,系统查找出50个,其中只有40个是真正的正样本,计算上述各指标。 TP: 将正类预测为正类数 40 FN: 将正类预测为负类数 20 FP: 将负类预测为正类数 10 TN: 将负类预测为负类数 30 准确率(accuracy) = 预测对的/所有 = (TP+TN)/(TP+FN+FP+TN) = 70%精确率(precision) = TP/(TP+FP) = 80%召回率(recall)

2020-05-12 15:39:14 436

原创 subprocess.CalledProcessError: Command '('lsb_release', '-a')' returned non-zero exit status 1.

sudo rm /usr/bin/lsb_release

2020-04-26 12:38:21 783

原创 django进入控制台(shell)

python manage.py shellfrom home.models import * #导入所有modelUser.objects.get(name=request.data['user']) #单一条件的结果File_list.objects.filter(user_id=request.session['user_id']) #使用where条件#django mode...

2020-04-22 12:16:15 820

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除