- 博客(65)
- 收藏
- 关注
原创 pre-training
预训练:使用尽可能多的训练数据,从中提取出尽可能多的共性特征,从而让模型对特定任务的学习负担变轻。预训练思想的本质a.模型参数不再是随机初始化,而是通过一些任务进行预训练b.将训练任务拆解成共性学习和特性学习两个步骤上面两句话分别从两个不同的角度来解释预训练思想的本质。第一句话从模型的角度,第二句话从数据的角度。预训练的做法一般是将大量低成本收集的训练数据放在一起,经过某种预训方法去学习其中的共性,然后将其中的共性“移植”到特定任务的模型中,再使用相关特定领域的少量标注数据进行“微调”
2024-03-14 02:13:12 394
原创 C++基础复习003
在STL中,默认情况下(不加后面两个参数)是以vector为容器,以 operator< 为比较方式,所以在只使用第一个参数时,优先队列。其中的a是起始值,n是整数的范围,n+a-1是终止值。以O(logn) 的效率查找一个队列中的最大值或者最小值,其中是最大值还是最小值是根据创建的优先队列的性质来决定的。rand()不需要参数,它会返回一个从0到最大随机数的任意整数,最大随机数的大小通常是固定的一个大整数。然后返回指向第一个重复元素的迭代器再用erase函数擦除从这个元素到最后元素的所有的元素。
2024-03-14 02:11:41 890
原创 8013Notes
似然比检验的思想是:“如果参数约束是有效的,那么加上这样的约束不应该引起似然函数最大值的大幅度降低。简单线性模型假设数据和响应变量之间是正态分布的关系,这个正态分布 就是 指数家族的一员。GLM 在lm的基础上进行扩展, 不再要求 “数据和响应变量之间是正态分布” 的关系, 而是要求 “数据和响应变量之间的关系是指数家族中的某一种” 即可。回顾likelihood,它给出了一种获取模型参数点估计的方法(MLE) ,模型是一堆PDF/PMF的joint, 而指数家族,就是一些经典常见的 PDF/PMF。
2023-03-16 00:37:10 61
原创 Iris dataset
由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Iris数据集是常用的。)三个种类中的哪一类。
2022-09-18 15:24:00 124
原创 python01
:Python中可以处理任意大小的整数,而且支持二进制(如0b100,换算成十进制是4)、八进制(如0o100,换算成十进制是64)、十进制(100)和十六进制(0x100,换算成十进制是256)的表示法。):浮点数也就是小数,之所以称为浮点数,是因为按照科学记数法表示时,一个浮点数的小数点位置是可变的,浮点数除了数学写法(如123.456)之外还支持科学计数法(如1.23456e2)。):布尔值只有True、False两种值,要么是True,要么是False。复习一下模2运算(CRC校验的核心部分)
2022-09-09 01:38:03 204 1
原创 anaconda入门
Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享程序文档,支持实时代码,数学方程,可视化和 markdown。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等.等科学计算库的集成包,省去了自己下载和安装各种包的麻烦,特别在linux上升级和安装python十分痛苦。Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。即:Anaconda是python和NumPy,SciPy。
2022-09-06 22:49:31 411
原创 基础:types of keys
当然,(FirstName, LastName, BirthTime)加上Gender,即 (FirstName, LastName, BirthTime, Gender)也是一个super key。假设有个表用来保存公司的员工,一个员工同时也是一个人,这个人的基本信息保存在另一个表Person中,这就需要引用别的实体。如果从一个super key中的属性中,去掉任何一个属性,都不能唯一确定一个实体,那么这个super key就是candidate key。所以,我们要做的是,用最少的事实描述一个人。
2022-09-05 17:25:18 269
原创 C++头文件
#include <algorithm>#include <iostream>#include <string>#include <vector>#include <map>,#include <unordered map>
2021-01-09 21:39:15 98
原创 计算机网络第1章-概述
《计算机网络第7版》 谢希仁计算机网络由若干结点和连接这些结点的链路组成,网络中的结点可以是计算机、集线器、交换机或路由器等。网络把许多计算机连接在一起,而互联网则把许多网络通过路由器连接在一起。与网络相连的计算机常称为主机(host)。...
2020-06-10 16:29:36 107 1
原创 1018 Public Bike Management (30分)
这道题对我来说是一个新知识点,一开始用dijkstra解,只有25分,原因是不能用后面节点多出来的车辆弥补前面。用dijkstra,25分#include <iostream>#include <cmath>#include <stack>using namespace std;const int inf=99999999;int vnum[520...
2020-05-21 08:53:44 269
原创 操作系统9,10,11,12
OS向用户提供了两类接口:用户接口和程序接口。一个是系统为用户提供的各种命令的接口,用户利用这些操作命令来组织和控制作业的运行或管理计算机系统。另外一种是系统调用,编程人员用来请求操作系统提供服务。什么是系统调用:系统调用提供了用户程序与操作系统之间的接口(即系统调用是用户程序和内核交互的接口)。用户接口类型:字符显示式联机用户接口、图形化用户接口GUI,脱机用户接口。联机命令分类:系...
2020-04-13 16:14:04 147
原创 操作系统8 磁盘存储器的管理
外存的分配通常以块为单位外存的组织方式:连续组织方式、链接组织方式、索引组织方式、NTFS的文件组织单位NTFS中,以卷为单位,一个卷一张主控文件表MFT,减少了磁盘访问次数。文件存储空间的管理:空闲表法、空闲链表法、位示图法、成组链接法。提高磁盘I/O 速度的途径:磁盘高速缓存、提前读、延迟写、优化物理布局、虚拟盘RAM,。提高磁盘可靠性的技术:有三级容错技术数据一致性控制:事务...
2020-04-13 13:22:12 348
原创 操作系统7 文件管理
文件系统:是指操作系统中与文件管理有关的那部分软件以及被它们管理的文件和文件属性的集合。文件、记录、数据项之间的层次关系有结构文件和无结构文件文件目录文件共享:基于索引结点的共享方式,利用符号链实现文件共享。文件保护:影响文件安全性的主要因素有:人为因素、系统因素、自然因素。...
2020-04-13 13:21:23 144
原创 操作系统6 输入输出系统
I/O系统是用于实现数据输入、输出和存储的系统。最主要的任务是完成用户提出的I/O请求、提高I/O速率以及改善设备的利用率,并为更高层的进程方便地使用I/O设备提供手段。I/O系统的基本功能:隐藏物理设备的实现细节、与设备的无关性、提高处理机和I/O设备的利用率、对I/O设备进行控制、确保对设备的正确共享、错误处理。对I/O设备的控制方式:①采用轮询的可编程I/O方式 ②采用中断的可编程I...
2020-04-13 13:20:43 170
原创 操作系统5 虚拟存储器
常规存储器管理方式的特征:一次性、驻留性。局部性原理:时间局部性:程序中的某条指令一旦执行,则不久后该指令可能再次执行;如果某个数据被访问,则不久后该数据可能被再次访问。产生局部性的典型原因是程序中存在着大量的循环操作。空间局部性:一旦程序访问了某个存储单元,则不久后,其附近的存储单元也将被访问。即程序在一段时间内所访问的地址,可能集中在一定范围内,典型情况就是程序的顺序执行。虚拟存储器...
2020-04-13 13:20:00 247
原创 操作系统4 存储器管理
通用计算机将存储器分为CPU寄存器、主存、辅存三个层次。主存是CPU可以直接访问的存储器,它的访问速度远低于CPU指令的执行速度。程序的装入:绝对装入方式、可重定位装入方式与静态重定位、动态运行时装入方式。装入指的是装入内存。程序的链接:静态链接方式、装入时动态链接、运行时动态链接连续分配方式:单一连续分配、固定分区分配、动态分区分配、动态重定位分配、伙伴系统、可重定位分区分配。分区...
2020-04-13 13:19:30 106
原创 操作系统3
为什么需要进行处理机调度?在多道程序环境下,内存中存在的进程数目往往多余处理机的数目,因此,需要通过处理机调度,动态地将CPU按照某种算法分配给就绪状态的一个进程。处理机调度的层次:高级调度、低级调度、中级调度进程调度的主要任务有保存当前进程的处理机现场,按照某种调度算法选取投入执行的新进程,以及把处理机分配给新进程三方面。进程调度可采取两种方式:抢占式调度和非抢占式调度。中级调度的...
2020-04-03 12:16:28 139
原创 操作系统2
进程是独立运行和资源分配的基本单位。前趋图是一个邮有向无循环图,可用来描述程序段或进程之间执行的先后次序关系。程序的顺序执行是指若干个程序或程序段之间必须严格按照某种先后次序来执行。程序的顺序执行具有下列特征:顺序性、封闭性、可再现性。程序的并发执行是指两个或两个以上的程序或程序段可在同一时间间隔内同时执行。特征:间断性、失去封闭性、不可再现性。进程表示一个并发执行的程序,进程控制块PC...
2020-04-01 22:35:49 168
原创 操作系统1
操作系统定义:操作系统是一组控制和管理计算机硬件和软件资源,合理地对各类作业进行调度,以及方便用户使用计算机的程序的集合。操作系统的目标:方便性:使计算机系统更易于使用。有效性:利用率和吞吐量。可扩充性:能方便地增加新的功能和模块,并能修改老的模块。开放性:使其与其他的系统之间能彼此兼容、方便地实现互连。操作系统的作用:是用户与硬件系统之间的接口(用户通过它提供的图形化接口、系统功...
2020-03-30 23:19:28 127
原创 计算机网络第6章-应用层
本章重要内容: (1) 域名系统DNS——从域名解析出IP地址 (2) 万维网和HTTP协议,以及万维网的两种不同的信息搜索引擎。 (3)电子邮件的传送过程,SMTP协议和POP3协议、IMAP协议使用的场合。 (4)动态主机的配置协议DHCP的特点。 (5)网络管理的三个组成部分(SNMP本身、管理信息结构SMI和管理信息库MIB)的作用 (6) 系统调用和应用编程接口的基本概念。 (7)...
2020-03-22 23:44:26 220
原创 计算机网络第5章-运输层
网络层和运输层的区别网络层为主机之间提供逻辑通信,运输层为应用进程之间提供端到端的逻辑通信。用户数据报协议UDP传输控制协议TCP运输层的复用和分用运输层的端口号,软件端口和硬件端口不一样,硬件端口是不同硬件设备进行交互的一种地址,而软件端口是应用层的各种进程与运输实体进行层间交互的一种地址。端口号只具有本地意义。UDP概述特点:无连接,尽最大努力交付;面向报文;UDP没有拥塞控...
2020-03-10 18:25:37 54 1
原创 计算机网络第4章-网络层
本章最重要内容:(1)虚拟互连网络的概念(2)IP地址与物理地址的关系(3)传统的分类的IP地址(包括子网掩码)和五分类域间路由选择CIDR(4)路由选择协议的工作原理分组交换虚电路并不是一条真正的电路,而电路交换是建立了真正的电路,所以他们只是类似,并不一样。虚电路是可靠交付。网络层向上只提供简单灵活的、无连接的、尽最大努力交付的数据报服务。网际协议IP是TCP/IP体系中两个最...
2020-03-04 22:35:30 51 1
原创 计算机网络第3章-数据链路层
本章中我们研究的是在同一个局域网中,分组怎样从一台主机传送到另一台主机,但并不经过路由器转发。 本章最重要的内容是: (1)数据链路层的点对点信道和广播信道的特点,以及这两种信道所使用的协议(PPP协议以及CSMA/CD协议)的特点。(2)数据链路层的三个基本问题:封装成帧、透明传输和差错检测。 (3)以太网MAC层的硬件地址。(4)适配器、转发器、集线器、网桥、以太网交换机的作用以及使用...
2020-03-02 20:04:02 63 1
原创 计算机网络第2章-物理层
本章最重要的内容是: (1)物理层的任务 (2)几种常用的信道复用技术 (3)几种常用的宽带接入技术,主要是ADSL和FTTx。用于物理层的协议也常称为物理层规程。物理层的主要任务为确定与传输媒体接口有关的一些特性:即机械特性,电气特性,功能特性,过程特性。一个数据通信系统可划分为三大部分,即源系统(或发送端、接收方)、传输系统(或传输网络)、目的系统(或接收端、接收方)。源系统一般...
2020-03-02 19:42:18 50 1
原创 高数笔记1
5类基本初等函数,以及定义域双曲函数夹逼定理柯西极限存在准则(柯西审敛原理)无穷大,无穷小左连续、右连续的概念闭区间上连续函数的性质:有界性与最大值最小值定理,零点定理,介值定理函数可导和连续性之间的关系:可导一定连续,连续不一定可导导数的含义导数和斜率、微分的区别导数和微分:导数是函数图像在某一点处的斜率,也就是纵坐标增量(Δy)和横坐标增量(Δx)在Δx趋近于0时的比值。...
2020-02-26 14:20:27 267
原创 PATAd笔记1
数字与字符串的转换https://blog.csdn.net/michaelhan3/article/details/75667066初始化数值型数组的时候,初始值应该用大括号括起来。double num1[10]={0.0},num2[10]={0.0};vector定义二维数组vector< vector<int> >road(N,vector<...
2020-02-18 15:41:15 282
原创 数据结构
索引结构和散列结构的区别索引存储结构是用结点的索引号来确定结点存储地址,其优点是检索速度快,缺点是增加了附加的索引表,会占用较多的存储空间。散列存储结构是根据结点的值确定它的存储地址(散列函数)随机存取结构:你想找第几个数据元素直接可以用下标找到。游标和指针...
2020-01-02 14:35:48 219
原创 C++ Primer【第九章-内存模型和名称空间】
C++头文件常包含的内容:·函数原型·使用define或const定义的符号常量·结构声明·类声明·模板声明内联函数在包含自己的头文件时,应该用引号而不是尖括号,因为:如果文件名包含在尖括号中,则C++编译器将在存储标准头文件的主机系统的文件系统中查找;但如果文件名包含在双引号中,则编译器将首先查找当前的工作目录或源代码目录(或其他目录,这取决于编译器)。如果在那里没有找到...
2019-12-23 18:40:40 114
原创 php笔记(知识点)
echo 可以输出一个或多个字符串,字符串可以包含 HTML 标签。isset函数和echo函数isset() 函数用于检测变量是否已设置并且非 NULL。如果已经使用 unset() 释放了一个变量之后,再通过 isset() 判断将返回 FALSE。若使用 isset() 测试一个被设置成 NULL 的变量,将返回 FALSE。foreach函数...
2019-12-18 14:15:33 90
原创 index.php
error_reporting函数error_reporting() 函数规定应该报告何种 PHP 错误。<?php // 关闭错误报告 error_reporting(0); // 报告 runtime 错误 error_reporting(E_ERROR | E_WARNING | E_PARSE); // 报告所有错误 error_reporting(E_ALL...
2019-12-16 13:46:01 749
原创 C++写数据结构
一. 二叉树的遍历//先序遍历void preorder(BinTree BT){ if(BT){ printf("%d",BT->data); preorder(BT->left); preorder(BT->right); }}//中序遍历void midorder(BinTree BT){ ...
2019-12-11 13:44:34 153
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人