自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 python拆分unpacking

原因:python处理赋值操作的时候,先对等号右边求值,会新建一个临时元组,将其存入这个元组里(‘b’, ‘c’),然后python对这个临时元组做unpacking,把它里面的元素分别放到等号左边的位置,于是list[1]=‘b’, list[2]=‘c’,做完unpacking后,系统会扔掉这个临时元组。尽量通过unpacking来拆解序列中的数据,而不要通过下标访问,这样可以让代码更简洁清晰。通过unpacking来赋值要比通过下标去访问元组内的元素更清晰,所需代码量通常也比较少。

2023-04-24 13:02:19 114

原创 python接口下载导出文档的三种方法【Nginx静态资源、临时文件、直接输出数据流文件不落盘】

【代码】接口导出文档的三种方法【Nginx静态资源、临时文件、直接输出数据流文件不落盘】

2023-01-06 16:46:59 501

原创 ElasticSearch- Mapping

除了整数、浮点数、true/false、日期、数组、对象、字符串之外,其他类型都必须显示映射【手工指定】,其他类型es无法自动识别,fields的mapping只能创建,无法修改。两种方式:dynamic mapping【动态映射/自动映射】;explicit mapping【静态映射/手工映射/显示映射】概念:定义文档及其包含的字段的存储和索引方式的过程。

2022-08-23 14:01:55 342

原创 Kafka概述

学习视频form B站尚硅谷。

2022-08-15 20:26:51 418

原创 DockerFile笔记

dockerfile面向开发,docker镜像成为交付标准,docker容器则涉及部署运维。

2022-08-14 23:33:55 182

原创 ElasticSearch-节点、分片、集群

副本分片主分片备份,不允许直接写入数据,只允许通过主分片做数据同步,写入只会写入主分片。主分片数据原始文件,支持读写;多个节点组成的高可用分布式系统。

2022-07-25 17:14:32 478

原创 ElasticSearch核心概念-压缩算法

100w条数据,1int=4Bytes,则数据索引需约为4MB【太大了】稀疏数组,差值大,deltalist仍然很大,for压缩算法不适用。

2022-07-25 11:27:55 1605 2

原创 Elasticsearch-Rest风格

rest

2022-07-20 19:11:49 443

原创 ElasticSearch核心概念

和Elasticsearch可以获益于更强大的硬件设备,但。真正的扩容能力是来自于—​为集群添加更多的节点,并且将中。ElastiSearch是的,它知道如何通过来提高扩容性和可用性。

2022-07-19 17:20:24 277

原创 Docker镜像、容器卷

Docker镜像的最底层是引导文件系统bootfs,以此为基础添加扩展Docker镜像层都是只读的,容器层是可写的,镜像的每一层都可以被共享。当容器启动时,一个新的可写层被加载到镜像的顶部【通常被称作容器层】,所有对容器的改动都只发生在容器层,不会改变底下的镜像docker commit提交容器副本使之成为一个新的镜像:docker commit -m=“提交的描述信息” -a=“作者” 容器ID 要创建的目标镜像名:[标签名]Docker挂载主机目录访问如果出现cannot open directory

2022-07-11 23:17:07 324

原创 docker基础知识及常用命令

Docker给出了一个标准化解决方案,提供容器虚拟化技术,使系统能够平滑移植解决了运行环境和配置问题的软件容器,方便做持续集成并有助于整体发布的容器虚拟化技术Docker:镜像技术【从系统环境开始自底向上打包,映像档即应用】容器虚拟化解决虚拟机的痛点【内存消耗运行时间】,不是模拟一个完整的操作系统,而是对进程进行隔离。将软件运行所需的所有资源打包到一个隔离的容器中,使其变得高效轻量并保证部署在任何环境的软件都能一致运行。Docker和传统虚拟化方式的不同:Docker镜像(Image)是一个只读模版,

2022-06-17 16:44:49 110

原创 python引用拷贝、生成器迭代器

引用VS拷贝赋值操作总是储存对象的引用,而不是对象的拷贝。赋值操作会产生相同对象的多个引用,在原处修改可变对象时,可能会影响程序中其他地方对相同对象的其他引用。拷贝方法:L[:]复制序列字典copy方法(X.copy())复制字典内置函数(如list)生成拷贝(list(L))copy标准库模块生成完整拷贝**注意:**无条件值的分片以及字典copy方法只能做顶层复制,不能复制嵌套的数据结构。使用标准的copy模块,copy.deepcopy(Y)对任意嵌套对象Y做完整的复制并行遍历:z

2022-05-24 17:30:00 362

原创 python列表与字典

不可变性:在核心类型中,数字、字符串和元组是不可变的;列表和字典是可变的。在其他方面,这种不可变性可以用来保证在程序中保持一个对象固定不变。字符串replace方法会对全局进行搜索和替换,但是不会改变原始的字符串,而是会创建一个新的字符串作为结果【字符串的不可变性】字典是一种映射(mapping),是一个其他对象的集合,但是通过键而不是通过相对位置来存粗的,它没有任何可靠的从左到右的顺序,只是简单的将键映射到值,是python核心对象集合中的唯一一种映射类型,具有可变性【可以就地改变,并可以随需求增大或

2022-05-20 15:58:56 2415

原创 【CSAPP】cha.1计算机系统概述

信息就是位+上下位系统中所有的信息——包括磁盘文件、存储器中的程序、存储器中存放的用户数据以及网络上传送的数据,都是由一串位表示的程序被其他程序翻译成不同的格式编译阶段:汇编语言程序中的每条语句都以一种标准的文本格式确切地描述了一条低级机器语言指令汇编阶段:汇编器as将hello.s翻译成机器语言指令,把这些指令打包成一种叫做可重定位目标程序的格式,并将结果保存在目标文件hello.o中【二进制文件】链接阶段:连接器Id负责合并成可执行目标文件,可以被加载到内存中,由系统执行系统硬件组

2022-01-13 18:08:33 1129

原创 进程特征、进程控制、进程通信【思维导图】

进程概念与程序的区别1.程序:一个指令序列2.进程是程序的执行(动态),程序是一组指令的有序集合(静态)3.进程有诞生和死亡(生命期),程序是永久的4.进程 = 程序+数据 +进程控制块PCB5.一个程序可对应多个进程【程序的多次执行】6.一个进程可包含多个程序进程是进程实体的运行过程【强调 “动态性” 】,是系统资源分配和调度的一个独立单位进程是动态的,进程实体是静态的特征动态性【最基本】进程是程序的一次执行过程,是动态地产生、变化和消亡的并发性内存中有

2021-07-19 12:08:14 588

原创 操作系统知识点整理cha.1绪论

操作系统的目标方便性、有效性、可扩充性、开放性1)方便性:易学易用2)有效性:提高系统资源利用率、提高系统吞吐量3)可扩充性:易于添加新的功能和模块,对原有的功能和模块进行修改4)开放性:制定软、硬件标准,遵循世界标准规范,彼此兼容实现互连操作系统的作用OS作为用户与计算机硬件系统之间的接口【用户通过OS来使用计算机、从下向上看】OS作为计算机系统资源的管理者资源:处理机、存储器、I/O设备、文件【数据和程序】处理机管理:分配和控制处理机存储器管理:内存的分配与回收I/O.

2021-03-27 15:33:03 257

原创 python3.6安装geopandas包

1. 从https://www.lfd.uci.edu/~gohlke/pythonlibs/下载Geopandas 依赖库:①GDAL:GDAL-3.1.4-cp36-cp36m-win_amd64.whl②Pyproj:pyproj-2.6.1.post1-cp36-cp36m-win_amd64.whl③Shapely:Shapely-1.7.1-cp36-cp36m-win_amd64.whl④Fiona:Fiona-1.8.18-cp36-cp36m-win_amd64.whl要点:安

2021-02-26 10:42:20 386

原创 数据科学/机器学习——特征选择【代码实例:银行电话营销】

特征选择要求:在保证一定分类精度的前提下,减少特征维度【“降维”】,使分类器实现快速、准确和高效的分类【关键:所提供的识别特征具有很好的可分性,使分类器容易判别】应去掉模棱两可、不易判别的特征所提供的特征不重复【去掉相关性强且没有增加更多信息的特征】特征选择从给定的特征集合中选出任务相关特征子集必须确保不丢失重要特征原因:减轻维度灾难、降低学习难度特征选择的一般过程子集产生:根据某种策略产生候选的特征子集前向搜索:逐渐增加相关特征后向搜索:从完整的特征集合开始,组件

2021-01-19 11:55:45 1607

原创 计算机网络笔记-cha.3网络层

数据链路层解决在相邻的两台主机间传输分组;解决收发的身份问题,即封装成帧、差错检测等问题所使用的信道点对点信道:单播,一对一的点对点通信方式【PPP】广播信道:一对多的广播通信方式,使用专用的共享信道协议来协调数据发送【CSMA/CD】点对点信道数据链路和帧链路:一条无源的点对点的物理路段,中间没有任何其他的交换结点,一条链路只是一条路径/通路的一个组成部分数据链路:除了物理线路外,还必须有通信协议来控制这些数据的传输,把实现这些协议的硬件和软件加到链路上,就构成了数据链路

2020-12-16 23:08:53 279

原创 机器学习/数据科学——关联规则挖掘

关联规则挖掘概述相关性检验:检验数据特征之间线性相关性的统计量,取值范围[-1,1],绝对值越大特征之间的相关性越强衡量指标重要性:用关联规则中包含的所有特征(X=A∪B)的支持度(support)S(X)来衡量【即为关联规则被多少比例的数据覆盖】置信度:衡量规则可信程度定量描述规则:给定数据集,找出所有不小于预先设置的支持度阈值min_suppt 和置信度阈值min_conf规则的集合强关联规则:在支持度和置信度两个方面满足最小的条件步骤:找到所有不小于支持度阈值的规则【频

2020-12-07 14:16:22 781

原创 数据科学/机器学习python——聚类模型【K-means聚类举例】

聚类模型无标签、无监督学习可以简化数据,有助于寻找数据的内部结构基于相似度【能把不同领域的数据相似度的度量融合进去,还可加入核函数】;基于特征【可以直接考虑原始的数据,避免因为度量距离而丢失某些信息】平坦聚类/分割聚类【直接将样本分割为多个不相交的子集】、层次聚类【通过构造具有层级的树形结构,在不同层次上对样本进行分割】K-means聚类起源于信号处理,是一种应用较广泛的聚类分析方法,目标是将n个样本划分到K个簇重,其中每个样本属于距离自己最近的簇【找到每个簇的中心,并最小化所有样本点到质

2020-11-21 20:01:30 1051

原创 数据科学/机器学习——集成模型【实例分析稍后放上,多稍后我也不确定...】

集成模型“三个臭皮匠,顶个诸葛亮”,个体方法总有不足,博采众长,考虑问题不同视角,通过将多个模型的结果进行综合,集成方法通常能获得比单个学习模型更好的预测性能以及更准确的结果,常应用于有监督模型。前提要求:基模型的预测能力比随即猜测好,且多个基模型之间具有差异性。集成方法:增强模型的表达能力;降低误差,大幅度提升模型预测性能【前提:基模型之间相互独立】集成分类器误差:构建集成模型步骤构造多个基模型可同一类型也可不同根据一定策略,将基模型组合成集成模型多数投票方法、平均值方

2020-11-10 11:19:36 1008

原创 计算机组成原理实验【不知道为什么一直在草稿箱里但懒得细看了就直接发了

延迟语句可仿真不可综合只能在仿真文件加延迟单指令ori赋值运算指令的运行方式:取指令、执行指令循环指令周期包含的阶段:取指令IF指令译码ID指令执行EXE存储器访问MEM【w/sw】结果写回WBIF取指令 PC+4ID←ROM[PC]PC←PC+4虽然不是所有指令PC+4拿出来【有一位空出来,默认为0assign pc4 = pc + 4ID固定的高六位always...

2020-10-21 21:55:38 218

原创 计算机组成原理实验——实现存储器模块Verilog

主存分类指令内存ROM:运行时指令不能改变 只有一个读接口,根据地址返回对应的指令 只读,一般用来存储指令数据内存RAM:ROM:raddr、rdata、CE数据初始化reg[31:0]inst_rom[0:1023];initial //法一:只能仿真,不能综合begin$readmemh(“ins.eme”,inst_rom); //读出放到inst_romend/IP核-ROM,IP核:知识产权核,只能用,不能知道怎么实现深度:多少条指令 宽度:每条指令几位分号结束,每个数据间

2020-10-21 21:53:15 3177

原创 数据科学/机器学习python——分类模型代码实现【KNN/ 决策树/ 逻辑回归/ 贝叶斯】

分类模型评估分类模型指标:正确率accuracy、F值F-measure、精度precision、召回率recall逻辑回归风险评估中最经典最常用的模型通常解决二分类问题,即预测目标y的取值范围为{1,-1}从线性回归到逻辑回归线性回归存在问题:y取值为连续实数而非离散值——解决:引入逻辑斯蒂函数,将连续性的输出映射到(0,1)之间当输入x很大或很小时,函数接近于0或1的值输出,σ(0)=0.5使用逻辑斯蒂函数,可将任意实数映射到(0,1)之间,在逻辑回归中可解释为样本属于正

2020-10-13 21:07:59 895 1

原创 计算机网络笔记——cha.1概述

计算机网络在信息时代中的作用-计网产生的主客观原因- 方便性(实时OS<分时OS<网络操作系统)- 安全性(冷战产物:战争中的通信问题)定义:由大量相互独立但彼此连接的计算机组成,共同完成计算任务“三网”计算机网络电信网络有线电视网络目标各不相同,但相互渗透计算机网络特点连通性目标:信息交流(便捷经济)共享性目标:资源共享信息(网站、微信)软件(系统软件、应用软件)硬件(打印机)因特网(互联网)网络与因特网网络:由.

2020-09-11 21:04:15 304

原创 数据科学/机器学习python——数据预处理方法(onehot编码 缺失值处理 数据标准化 离群值检测)

数据预处理方法特征编码数字编码简单的数字编码:从0开始赋予特征的每一个取值一个整数收入水平={贫困,低收入,小康,中等收入,富有} → 收入水平={0,1,2,3,4}但这样的数字编码后的数据,引入了本不存在的次序关系,会导致后续错误的建模分析结果,骨为了避免上述误导性的结果,对于离散型特征(特别是名义型特征),使用One-Hot编码One-Hot编码将包含K个取值的离散型特征转换成K个二元特征(0/1)优点:不会人为地引入次序关系,不同的原始特征取值之间拥有相同的距离,线性回归

2020-09-11 20:08:22 1959

原创 python基础复习3——字符串一些需要注意的地方

字符串-’’‘三引号占用的内存空间(引号与内容不在同一行)与’/’'单双引号占用的内存空间不同【三引号需保存格式== - 比较内容is - 比较地址s1 = 'abc's2 = "abc"s3 = '''abc''' #'''三引号占用的内存空间(引号与内容不在同一行)与'/''单双引号占用的内存空间不同【三引号需保存格式print(id(s1),id(s2),id(s3))print(s1 == s2) #比较内容print(s1 is s2) #比较地址print(s

2020-08-11 16:01:09 123

原创 python3.7基础复习2——嵌套循环,print(‘0‘,end=‘‘)

pirnt(‘0’) -输出0后换行print(‘0’,end=’’) -输出0后不换行,为end传递一个空字符串,这样print函数不会在字符串末尾添加一个换行符,而是添加一个空字符串。# 打印三角形# *# **# ***# ****row = 1while row <=4: #print('*'*row) ——直接 #嵌套while count = 1 while count <= row: print('*',end='')

2020-08-07 16:40:26 612

原创 计算机组成原理实验——单周期CPU的实现Verilog

小组组员共同完成://Verilog//cpu模块:module cpu( input clk, input oc, input rst, input [3:0] switch, //开关输入数据 output [31:0] displaydata //输出到led数据 ); //ID wire[5:0] opcode; //指令类型 wire[5:0] func; //指令功能码...

2020-07-28 15:08:02 3362

原创 python3.7基础复习1

序列序列:一种数据结构,它包含的元素都进行了编号(从0开始)典型序列:列表、字符串、元组列表可修改,元组不可修改(一旦创建便固定)列表方法:x=[2,8,4,6,7]x.append(4)-末尾添加新对象x.count(4)-统计某个元素在列表出现的次数a=[1,2,3]x.extend(a)-末尾扩展新列表x+a,并不会修改原列表,而是重新创建一个包含了x和a的新列表,用x=x+a 的连接操作效率会比extend方法低x.index(2)-返回2第一个匹配项的索引位置x.ins

2020-07-27 17:05:24 131

原创 计算机组成原理——存储系统思维导图

如有错漏之处,敬请指正

2020-07-25 17:18:11 1066

原创 计算机组成原理——运算器思维导图

如有错漏之处,敬请指正

2020-07-25 17:07:34 1619

原创 计算机组成原理实验——实现寄存器堆模块Verilog

寄存器寄存器是中央处理器内的组成部分寄存器是有限存贮容量的高速存贮部件用来暂存指令、数据和地址MIPS指令需要32个寄存器,采用寄存器-寄存器结构需要用数组表示寄存器堆寄存器堆需要有两个数据输出接口,同时输出;一个输入接口0号寄存器不能保存数据,固定为0读两个要求1raddr1读地址2raddr2写四个要求1waddr哪个寄存器2wdata数据3clk等脉冲上升沿4W...

2020-07-03 15:06:29 11916 1

原创 递归python——数据结构3

基线条件、递归条件基线条件:函数不再调用自身,避免死循环【即限制条件】递归条件:函数调用自身栈执行函数中途调用另一个函数时,当前函数暂停并处于未完成状态栈:先进后出【装箱,最晚放进来的最早拿出去】使用方便,但存储详尽信息可能占用大量内存,每次函数调用都需占用内存,当n越大,程序运行效率越低。解决:1循环 2尾递归...

2020-06-03 00:04:08 160

原创 选择排序python——数据结构2

选择排序将无序列表变为有序列表每次从列表中找到最大/最小的元素,依次放入新列表中每次查找最小元素时,所需要的时间都为O(n),共需查找n次,则需要的总时间位O(n×n),即O(n²)【n+(n-1)+(n-2)+…+2+1 = (1+n)*n/2 = n²/2+n/2】#python实现代码def findSmallest(arr): #找到最小元素 smallest = arr[0] smallest_index = 0 for i in range(1, len(arr)): #

2020-05-26 10:27:51 231

原创 二分/折半查找python——数据结构1

二分/折半查找顾名思义,对半查找,每次查找从中间开始,比中间的数大就去掉前半部分,对后半部分继续查找,直到找到对应数。前提条件:顺序排列 有序数组low = 0high = len(list) - 1比较中间的元素mid = (low + high) / 2 //非偶自动向下圆整guess = list[mid]小了,改low:if guess < elem:low = mid + 1大了,改high:if guess > elem:high = mid - 1

2020-05-25 09:32:18 266

原创 Verilog HDL程序基础——计算机组成原理实验

模块的一般语法结构设计块module 模块名(端口名1,端口名2,…);        端口类型说明(input,output,inout);        参数定义(可选);        数据类型定义(wire,reg等);……………………………说明部分…………………………………        实例引用低次层模块和基本门级元件;&

2020-05-09 16:46:37 994

原创 用python将txt文本中的数据导入excel

前几天货金小组课程报告,组长派了个任务让把paper中的表格数据做成突表,实在是懒得一个个数据手敲上excel,寻思着能不能写个小代码直接导入excel【结果本菜鸡捣鼓了超久,菜鸡本菜】from openpyxl import Workbook,load_workbookbook_name_xlsx = r'D:\数据1.xlsx' #文件路径,把文档路径复制过来即可wb = Workb...

2020-05-06 22:40:10 5168

原创 计算机组成原理实验1#Verilog相关问题

Verilog问题标量表示:reg~~[0:0]~~ →reg数字规范问题:rst = 1 → rst = 1’b1, data=data+1’b1时序电路用非阻塞【<=】,组合电路用阻塞【=】①时序电路:有无边缘触发任意时刻的输出不仅取决于该时刻的输入,还与电路原来的状态有关。电路里面有存储元件(各类触发器,在FPGA 芯片结构中只有D 触发器)用于记忆信息,从电路行...

2020-04-21 08:56:27 583

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除