自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 centos7版本运行python机器学习模型

在利用conda环境下载pytorch的时候,会遇到网速很慢的情况,可以选用#清华镜像网站。

2023-12-09 23:39:41 206 1

原创 线性结构的存储类型

顺序表节点的定义基本上继承了线性表的模板,不同的是首先要定义一个数组,数组的最大长度为maxsize,数组当前元素的个数为curlen,只有在下标零到当前元素的区间中的那些数据在逻辑上是有效的。

2023-04-27 00:52:57 572

原创 数据结构与算法

散列是一种特殊的索引结构,本身也是一种存储结构,散列可以通过关键码的一个映射,在整个散列单位中用单位时间快速找到其它的存储地址,然后读出相应的数据。数据的存储结构是从逻辑到其物理存储单元的一个映射,物理存储单元必须在内存中,因为数据必须在内存里才能跟CPU进行直接的通讯才能完成计算操作。数组存储地址之后,我们可以根据地址找到其他元素的起始存储地址,数据结构中所定义的节点的存储空间是连续的,主节点申请的地址是连续的,索引:对这个数据建立一个索引表,通过这个表能够有效的找到相应数据的存储地址。

2023-04-26 22:34:12 325

原创 python 利用flask进行web开发

app是Flask的实例,它接受包或者模块的名字作为参数,但一般都是传递__name__,让flask_helpers.get_root_path函数通过传入这个名字确定程序的根目录,以便获得静态文件和模板文件目录。3:使用app.route装饰器会将url和执行的视图函数的关系保存到app.url_map属性上,处理URL和试图函数的关系就是路由,这里视图函数就是hello_world。引入Flask类,Falsk类实现了一个WSGI应用。定义:app = flask.Flask(“web”)

2023-04-26 00:10:54 257

原创 N皇后问题-利用python实现

在典型的四叉树的结构中,我们的前提是一个4×4的网格,在网格中,我们所要面临的问题是同一行,同一列上,或者是对角线上都不能出现2个皇后,在解释这个问题时,问题划分为以下步骤求解。2选定第一列(行)的元素后,第二列(行)的元素有三种可能3 依次选择第三行和第四行的元素。

2023-01-01 09:58:22 482

原创 软件测试实验设计-全因子实验设计结对测试:

全因子实验测试中结对测试实验示例

2022-10-29 23:00:06 146

原创 栈与队列-之出栈和入栈

栈的基本概念,以及出栈和入栈的对应顺序分析

2022-10-13 01:00:02 7346

原创 数据结构与算法-线性表介绍

线性表中对栈、队列的分类;以及顺序表和链表的区别

2022-10-11 01:07:33 196

原创 高级数据结构与算法基本概念

数据结构预算法基础,主要序列,记录以及不同关键码

2022-10-10 00:40:29 224

原创 Python数据类型处理

空值:判断空值:import pandas as pdpd.isnull(x)df 列去掉空值:df.dropna(subset=[‘label’])df[df.label.notnull()]判断数据类型:数字(int)、浮点(float)、字符串(str),列表(list)、元组(tuple)、字典(dict)、集合(set)#判断变量类型的函数 def typeof(variate):type=None if isinstance(variate,int):type = “int

2022-02-15 11:33:48 468 1

原创 高级数据结构与算法

1;(46,74,16,53,14,26,40,38,86,65,27,34)利用直接排序的思想,第一步应该是46,与后面的数组中最小的元素进行替换;结果为(14,74,16,53,36,26,40,38,86,65,27,34)第二步为n=2与的位置上的元素与min(arr[i])的i替换res(14,16,74,53,36,26,40,38,86,65,27,34)第三步为重复第二步的操作(14 16 26 53 36 74 40 38 86 65 27 34)2;{E,A,S,Y,

2021-12-12 12:43:38 464

原创 python 基本数据处理

1,分箱操作1.1 等区间分箱pd.cut(array, num)在python plt的画法中,plt.hist(array, bins)是默认为等距分箱的操作1.2 等频分箱pd.qcut(array, num)1.3 卡方分箱

2021-11-08 10:01:43 1641

原创 二代征信数据

link银行专业术语:征信第二代收录目前为D1/R1/R2/R3/R4分别对应市场中的账户类型为:∙\bullet∙ 非循环贷账户(D1);∙\bullet∙ 循环额度下分帐户 (R4);∙\bullet∙ 循环贷账户(R1);∙\bullet∙ 贷记卡账户(R2);∙\bullet∙ 准贷记卡账户(R3)∙\bullet∙ 催收账户(C1)...

2021-10-20 10:59:32 3604

原创 密码学 网络安全(3)

密码学密码学:提供了通信安全的基础∙\bullet∙ 通信安全包括:– 保密性– 真实性– 完整性– 不可否认性加密流程密码分析∙\bullet∙密码分析试图破解出加密消息的密钥或明文∙\bullet∙密码分析的类型–密文攻击已知C1=E_K(P1),C2=E_K(P2),…推导出P1,P2,…或KC加密之后的秘闻,P是明文,E是加密方法,K是密钥– 已知明文攻击已知P1,C1=E_K(P1),P2,C2=E_K(P2),…推导出K或某种算法,Ci+1=E_K(Pi+1)中获得

2021-10-17 19:20:41 2438

原创 互联网历史(2)

美国国防部高级研究计划局:开发了ARPANET∙\bullet∙基于网络控制协议NCP1980年代ARPANET开始使用TCP/IP(1983年1月1日)DARPA资助Berkeley UNIX开发NSF美国国家科学基金会创建了一个超级计算机网络,由一个骨干网络支持,骨干网络带宽:56Kbps(1986)1990和2000年代∙\bullet∙Berners-Lee创建了WWW,创建了http,超文本传输协议,第一个WWW服务器∙\bullet∙移动互联出现∙\bullet∙Cap’s c

2021-10-16 17:00:15 99

原创 网络安全及安全分析(1)

软件错误,缺陷和故障∙\bullet∙ 程序没有按照预期进行表现– 程序崩溃不是用户的预期– 执行结果错误执行结果出现错误– 后门一些特殊的,给埋后门的人或者开发者、攻击者,在正常权限下不能获得的服务,比如说:路由器、摄像头存在后门,允许攻击者或者恶意用户,在不知道的情况下访问设备,获取网络流量,或者摄像头的记录。∙\bullet∙ 性能– 停止响应比如运行软件,运行的时候停止响应,没有按照预期性能表现– 缓慢∙\bullet∙ 开发者的预期预期的来源– 开发者预期– 来源于

2021-10-16 09:48:10 2077

原创 线性代数(2)

张成空间:行向量张成空间的秩与其行向量本身的秩是相同的,即r(A)=n,张成空间的集合为Rr(a)R^{r(a)}Rr(a).如果行向量{A1,A2,..,AnA_1,A_2,..,A_nA1​,A2​,..,An​}线性相关,所以矩阵A不是行满秩的。在乘法列观点中,张成空间的值域列空间。在列向量矩阵函数Ax=yAx=yAx=y中,yyy是列向量的线性组合。...

2021-10-12 12:18:06 635

原创 时间序列分析

时间序列分析在于检验不同时间的样本分布,这里不同时间是以时滞k来说明,一:相同时间的样本分布简单的时间序列比如当k=0时,cov(Yt1,Yt1)cov(Y_{t_1},Y_{t_1})cov(Yt1​​,Yt1​​)是为等于方差,所以相同分布,协方差就等于方差,相关系数为1,...

2021-09-30 09:11:12 1095

原创 t检验方法

t检验定义:t检验又称为学生式检验,主要是用于样本含量小(小于30个),总体标准差δ未知的正态分布。t=样本均值−总体均值标准误差t=\frac{样本均值-总体均值}{标准误差}t=标准误差样本均值−总体均值​其中标准误差是按照的样本的值来计算的,标准误差=S(样本标准差)n(样本大小)标准误差=\frac{S(样本标准差)}{\sqrt{n}(样本大小)}标准误差=n​(样本大小)S(样本标准差)​H0:H_0:H0​:根据实际的要证明的情况来做出假设。F检验F检验的原则:记两独立总体为:

2021-09-29 16:44:33 2916

原创 机器学习调参方法

一:网格搜索from sklearn.model_selection import GridSearchCV #网格搜索网格搜索,就是在给定的字典参数里寻找最优的参数,缺点是:寻找到最优的参数是给定的,不一定是全局最优learning_rate = [0.0001,0.001,0.01,0.1,0.2,0.3] #学习率gamma = [1, 0.1, 0.01, 0.001]dict(learning_rate = learning_rate,gamma = gamma)#转化为字典格式,网

2021-09-27 09:22:03 184

原创 线性代数基础(1)

基本概念:

2021-09-26 16:40:54 431

原创 数据挖掘与机器学习

加粗样式什么是多重共线性?如何识别多重共线性?多重共线性是指预测变量之间有很高的关系度。

2021-09-24 23:38:30 141

原创 云计算-虚拟化-虚拟机

虚拟机虚拟机是IaaS服务提供给用户的主要接口。关键的接口,物理层有哪些层次,每一层都是什么样的接口?已有接口,虚拟化通过间接层来实现,在已有的堆栈,现有的层次中,插入一个间接层。在插入虚拟机之前,一般要考虑间接层在哪?在已有的简介层上插入接口,实现间接层位置。在学习虚拟机的时候,库和运行时不是十分重要。虚拟机的两个重要接口:第一个就是硬件提供给软件环境的接口,ISA,叫指定集架构,Instruction Set。 硬件提供给所有软件用的接口,整个软件环境的视角。第二个接口,操作系统提供给应

2021-09-14 23:41:38 1696

原创 How to Read a Visualization Research Paper: Extracting the Essentials

challenge:挑战Reading the many scientific papers and capturing their essential information is a challenge.Aim:to discover what research has already been carried out in a given field (solvedproblems) and what research hasn’t (unsolvedproblems).Several s

2021-06-27 02:07:34 94

原创 监督学习方法

1;广义线性模型:2;对数几率回归数几率函数:y=11+e−xy=\frac{1}{1+e^{-x}}y=1+e−x1​(2.1),对数几率函数是一种"Sigmoid函数",它将z值转化为0或1的yyy值,将此函数作为g−(.)g^-(.)g−(.)将yyy视为样本xxx作为正例的可能性,对几率取对数则得到“对数几率”,lny1−yln\frac{y}{1-y}ln1−yy​. (2.2).此处xxx为样本xxx,预测实际是去逼近真实值,其对应的模型为"对数几率回归",公式2.1的yyy视为后

2021-06-04 00:33:47 352

原创 Python连接数据库进行操作

sqlalchemy连接mysql

2021-01-14 18:00:46 164

原创 CART决策树回归

不同于分类决策树,回归决策树返回预测值

2020-08-01 14:31:05 418

原创 金融风控:vintage、滚动率、迁徙率

Vintage:本意是和酒相关,在金融里用来形容时间段Vintage口径下的滚动、迁徙是不同时间段的滚动迁徙,在金融里比较常用的是MnM_nMn​,以逾期时间来观察最后的坏账,以时间的对比来观察首逾率的变化:二:迁徙率一般选择在目标时间段内的时间来进行计算,比如按天来计算迁徙率,...

2020-07-21 16:25:01 3799

原创 聚类分析基础-相似度计算

相似性:1;二元变量对于二元变量,我们通常比较为1的数据占比比例,对于为0的一般不比较相似性,因为没有目标特征的样本其差异无法判断。2;标量对只有大小,没有方向的两个样本,用欧几里何距离:e.g:y=(1,4,6),x=(3,5,120)e.g:y=(1,4,6),x=(3,5,120)e.g:y=(1,4,6),x=(3,5,120),则两样本之间的相似性为d=(1−3)2+(4−5)2+(6−120)2d = (1-3)^2+(4-5)^2+(6-120)^2d=(1−3)2+(4−5)2+(6

2020-07-10 18:09:15 3504

原创 数据分析模型漏斗模型

占坑

2020-07-08 10:17:13 374

原创 深度学习入门图像变换-图片的操作与处理

1;读取图片from PIL import Imagephoto = Image.open(path)photo## 图片的像素展示与调整print(photo.size)photo = photo.resize([128, 128])print(photo.size)photoimport numpy as npIm = np.array(photo)# 处理后可以进行代数运算print(Im.shape)Im[:,:,0]# 展示某一层的数据对图像每层的数据进行操作

2020-07-08 00:53:36 603

原创 各个时区的时间转换

python 中时间格式转换import time, datetimestamp to datetimetimestamp = time.time() # 当时时间下的时间戳zerotimestamp = datetime.datetime.utcfromtimestamp(time.time()) # 当时时间戳下巴黎时间计时的时间戳在时间戳上利用秒计时来实现时间的加减,adjust_stamp = timestamp + 604800 # 时间推迟一个星期adjust_timesta

2020-07-03 15:54:34 1876

原创 学习器利用错误率性能比较检验方法

比较检验是为了对机器学习器性能值进行评估的方法:一般的我们都有F1-score值,ROC值如果进行泛化比较,一般含有不同样本值、样本大小和重复测试都会造成最终性能度量值的不同。所以要寻求新的检验方法:hypothesis test提供了,前提:测试集观察结果A如果优于B,则A的泛化性能在统计意义上是否也会优于B,以及这个结论的把握程度(置信度),性能度量指标为∈一:假设检验(两种)假设检...

2020-05-08 15:56:12 897

原创 [数学模型]正态分布检验

如何检验一个分布是否为正态分布概率密度分布曲线表达式为:f(x)=12πσexp−(x−μ)22σ2f(x)=\frac{1}{\sqrt{2π}σ}exp^{-\frac{(x-μ)^2}{2σ^2}}f(x)=2π​σ1​exp−2σ2(x−μ)2​下面以[房屋的评分系统数据][1]作为说明,提取码:g50t:import numpy as npimport pandas as...

2020-04-29 16:55:20 1340

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除