自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(160)
  • 收藏
  • 关注

原创 服务器程序挂后台运行

当我们在终端使用TMUX时就可以使得终端会话窗口不会因网络中断而退出,即我们可以在断开服务器的情况下继续运行我们的程序,当我们重新连上服务器,再次进入TMUX后,还可以看到程序的运行状态和结果。

2023-05-03 16:31:13 450 1

原创 自注意力机制(self-attention)

输入的类型输入一堆向量文字处理声音讯号图的节点可以看作一个向量表示输出是什么呢每一个向量都有一个标签应用:词性标注,语音,social network整个句子有一个标签应用:情感分析,语音辨认,图机器自己决定输出多少个标签应用:seq2seq(机器翻译)

2022-10-29 19:05:28 1320

原创 RNN模型与NLP应用(4)LSTM模型

这篇主要讲述LSTM的基本过程以及实现代码,LSTM是一种RNN模型,是对Simple RNN的改进如下图,LSTM有四个参数矩阵LSTM避免梯度消失问题,可以有更长的记忆。

2022-10-27 20:06:35 675

原创 RNN模型与NLP应用(3):Simple RNN

代码实现'数据集读取与预处理' # 此处使用Keras库自带函数进行简洁实现(从零开始实现请看上一节) # 使用keras的embedding层处理文字数据(同样使用imdb数据集) from keras . datasets import imdb from keras import preprocessing。

2022-10-26 13:56:00 725

原创 RNN模型与NLP应用(2):文本处理与词嵌入

假定w=7,一个句子如果超过了7,将前面的截断,保留后面w个词,同时也可以保留前面词,截断后面的词,如果这个句子比w还短,则在前面pad it with zeros,这样都可以存储在一个矩阵里面。利用word Embedding层将每个单词映射到低维向量,所以每个长度为20的电影评论都可以被Flatten成160维向量,最后用线形分类回归器分成0和1的数,0代表负类评论,1代表正类评论。我们的任务是学习训练出来的词向量会带有感情色彩,就比如好的感情色彩的词应该在一块,则它们的词向量应该相似。

2022-10-22 19:05:27 637

原创 RNN模型与NLP应用(1):数据处理基础

这章主要介绍RNN原理以及在NLP的应用,在看了几个RNN的视频之后,对RNN基础知识有了了解,作为深度学习的小白来说,还是从基础到应用来做一个记录,,可以用哈希表,如果在哈希表出现过,将表里的该词频数加1,如果没有在哈希表出现过,将该词加入哈希表,并将词频置为1,再排序从大到小,,在字典找不到的词,有可能是新词,也可能是拼写错误的词,在做one-hot Enconding 编码是可以忽略,也可以编码为0。如下图所示,假设用索引编号,美国加中国等于印度,这是不可能的。把文本变成单词的列表,

2022-10-22 15:07:59 341

原创 经典论文《Efficient Estimation of Word Representations in Vector Space》学习笔记

下一个词的出现仅依赖于前面的一个词或几个词语言模型评价指标:困惑度语言模型是无监督的任务。和上面过程类似,得到v个概率,再通过反向传播,进行梯度下降,得到词向量矩阵,有一些词或词组在语料中没有出现过,但是这不能代表它不可能存在。平滑操作就是给那些没有出现过的词或者词组也给一个比较小的概率。● batch问题,批次,补pad位,rnn可变长输入。,指数操作,让数为正数,使它成为0到1之间。,通过索引知该词的概率,目标是要。,再与周围词向量矩阵相乘,得到。,与词向量矩阵相乘,得到。● 统计语言模型中的。

2022-10-21 21:22:33 463

原创 【吴恩达深度学习】——NLP和Word Embedding

这种表征方式使得词与词之间的相似性很容易表征出来,这样对于不同的单词,模型的泛化性能会好很多,下面使用t-SNE算法将高维的词向量映射到2维空间,进而对词向量进行可视化,很明显可以看出对于相似的词总是聚集在一块。

2022-10-02 18:39:36 1176

原创 ML学习笔记--Word Embedding

机器通过阅读大量的文章来学习单词的意思,通过上下文来理解一个单词

2022-10-01 20:46:28 540

原创 神经网络反向传播+过程+思维导图

反向传播算法

2022-09-22 21:24:06 246

原创 RNN+基本原理+思维导图

从BP算法,CNN(卷积神经网络)中会发现, 它们的输出都是只考虑前一个输入的影响而不考虑其它时刻输入的影响, 比如简单的猫,狗,手写数字等单个物体的识别具有较好的效果. 但是,, 这些算法的表现就不尽如人意了.因此, RNN就应运而生了.

2022-09-22 19:43:30 264

原创 CNN+基本原理+思维导图

1.参数数量太多2.对于图像识别任务,每个像素和其周围像素的联系是比较紧密的,和离的远的像素的联系可能就很小了3.网络层数的限制通过剃度下降方法训练深度全连接神经网络很困难,剃度很难超过3层,不可能得到很深的全连接神经网络,也就限制了能力。

2022-09-22 09:48:55 282

原创 统计学习方法-感知机

感知机是通过划分一个超平面把不同类别的数据分开,可以理解为一条直线划分开一个二维平面中不同类型数据一样,属于线性模型,,可以通过多个单层感知机相互连接传递信息构建一定规则的结构(多层感知机)就可以优化这个问题,单层感知机是线性模型,多层感知机是非线性模型。

2022-09-12 21:52:42 433

原创 python数据处理—pandas相关函数的使用(持续更新)

pandas相关函数处理,sort() , drop() , shape()

2022-09-10 17:57:08 2255

原创 【决策树】算法实现(持续更新)

决策树是一种常见的机器学习方法,在以二分类任务为例,我们希望从给定的训练集学得一个模型用以对新示例进行分类,这个把样本分类的任务,可看作对“当前样本属于正类吗?“这个问题的决策或者判别的过程,顾名思义,决策树是基于树的结构来进行决策的,是一种有监督的学习算法。

2022-09-04 17:21:21 736 2

原创 文本相似度之编辑距离算法

编辑距离1.基本思想:将一个字符转化为另外一个字符所需的最少操作次数,可以是替换字符,插入字符,删除字符,可用与计算两个文本的相似度2.算法的基本原理:对于字符串a[1:i]和字符串b[1:j]来说,用edit[i][j]表示它们间的编辑距离。如果a[i]和b[j]相同,则edit[i][j]=edit[i-1][j-1]。如果a[i]和b[j]不相同,则有如下情况:1)a[1:i]经过多次操作转化为b[1:j-1],然后再在结尾插入字符b[j]即可,edit[i][j]=edit[i][j-1]

2022-03-30 17:48:35 1090 7

原创 初识simrank

simrank1. simrank的基本思想基于图结构的相似度计算方法,如果两个实体相似,那么跟它们相关的实体应该也相似。就如下图,如果a和c相似,那么A和B应该也相似,因为A和a相关,而B和c相关。基本公式:直接使用上面的迭代公式很难展开并行计算,数量稍微大一些(比如上十万)时在单机上跑时间和空间开销非常大。所以给出矩阵形式例1.计算图1中节点SimRank相似度,其中c=0.6根据定义,每个节点跟自己相似度为1,由于节点1没有入边,因此节点1与任何节点相似度为0s(2,3)=c1∗

2022-03-21 18:39:28 3015 3

原创 软件测试期末复习总结

第一章 软件测试基础1.软件测试的定义:软件测试就是对软件产品进行验证和确认的过程,是软件质量保证的关键元素,代表了需求规格书,设计和编码的最终检查。2.软件测试的目标:尽快尽早地发现软件产品在整个开发生命周期中存在的各种缺陷,以评估软件的质量是否达到发布的水平。3.软件测试不能确保没有缺陷,只能尽早尽快找到至今没有被发现的缺陷的原因:(1)测试的覆盖率几乎不可能达到100%(2)去除现有的缺陷可能会产生新的缺陷,同时系统的需求也在不断变化,这种需求的不稳定性也将带来新的缺陷(3)测试工程师

2021-11-29 21:52:35 1303

原创 NLP学习笔记----正则表达式与Numpy的应用

1.匹配字符串1.1获取包含关键字的句子查找哪些句子包含"爬虫"这个关键字import retext_string='文本最重要的来源无疑是网络,我们要把网络中的文本获取形成一个文本数据库。利用一个爬虫抓取到网络中的信息。爬取的策略有广度爬取和深度爬取。根据用户的需求,爬虫可以有主题爬虫和通用爬虫之分。'regex='爬虫'p_string=text_string.split('。')for line in p_string: if re.search(regex,line) is n

2021-11-07 14:40:42 402

原创 知识图谱学习笔记(二)——neo4j入门

一.知识图谱里的知识存储-Neo4j社交、电商、金融、零售、物联网等行业的快速发展,现实世界的事物之间织起了一张巨大复杂的关系网,传统数据库面对这样复杂关系往往束手无策。因此,图数据库应运而生,图数据库(Graph database)指的是以图数据结构的形式来存储和查询数据的数据库,Neo4J属于原生图数据库,其使用的存储后端专门为图结构数据的存储和管理进行定制和优化的,在图上互相关联的节点在数据库中的物理地址也指向彼此,因此更能发挥出图结构形式数据的优势。二.Neo4j的数据存储形式neo4j的数据

2021-10-29 21:13:28 538

原创 知识图谱学习笔记(一) —— 知识图谱介绍

一.知识图谱的简介1.1引言2012年,谷歌发布"知识图谱"的新一代"智能"搜索功能,初中是优化搜索引擎返回的结果,增强用户搜索质量以及体验。现在的聊天机器人,证券投资,智能医疗,自适应教育,推荐系统,无一不跟知识图谱相关,在技术领域的热度也在逐年上升。1.2概念知识图谱是一种典型的多边关系图,由节点(实体)和边(实体之间的关系)组成,本质上是一种语义网络,用于揭示万物之间的关系,知识图谱的一种通用表示形式是三元组形式,头实体,尾实体,两个实体之间的关系1.3应用知识图谱旨在从多种类型的复杂数据

2021-10-28 21:01:37 1436

原创 双非保研边缘生的心路历程

距离填志愿已经过去一个星期多了,拟录取后刚好是国庆,可以轻轻松松去玩了,回到学校,收拾一下自己的心情,记录一下短短半个月的推免历程,对自己大学前三年做一个总结,开始下一个阶段新路程。个人背景本科:双非(四非)计算机科学与技术排名:1/41英语:六级456(飘过)科研经历:核心期刊论文(二作),一个关于管理考场系统项目竞赛:无国奖(硬伤),若干省奖(比较水)前期不确定自己能不能拿到推免名额,3月份到9月份一直准备考研,和大多数同学一样复习高数,专业课,英语,考研的目标学校专业课是408,到9月

2021-10-07 19:46:57 652 5

原创 1531-智力大冲浪

目录描述输入输出样例输入样例输出代码实现思考描述小伟报名参加中央电视台的智力大冲浪节目。本次挑战赛吸引了众多参赛者,主持人为了表彰大家的勇气,先奖励每个参赛者m元。先不要太高兴!因为这些钱还不一定都是你的?!接下来主持人宣布了比赛规则:首先,比赛时间分为个n时段,它又给出了很多小游戏,每个小游戏都必须在规定期限前完成。如果一个游戏没能在规定期限ti前完成,则要从奖励费m元中扣去一部分钱wi,wi为自然数,不同的游戏扣去的钱是不一样的。当然,每个游戏本身都很简单,保证每个参赛者都能在一个时段内完成,而且

2021-04-13 23:04:02 333

原创 1304-售货员的难题(递归+回溯)

目录题目描述输入输出代码实现思考题目描述某乡有n个村庄( 1 < n < 40 ),有一个售货员,他要到各个村庄去售货,各村庄之间的路程s(0 < s < 1000 )是已知的,且A村到B村与B村到A村的路大多不同。为了提高效率,他从商店出发到每个村庄一次,然后返回商店所在的村,假设商店所在的村庄为1,他不知道选择什么样的路线才能使所走的路程最短。请你帮他选择一条最短的路。3 {村庄数}0 2 1 {村庄1到各村的路程}1 0 2 {村庄2到各村的路程}2 1 0 {村庄

2021-04-01 23:06:53 555

原创 骑士巡游问题(递归+回溯)

题目描述输入 n ( 1< = n < = 10 ) 代表棋盘的规模就是 n*n 的规模,骑士永远从 (1,1) 出发,要求骑士走遍所有棋盘的格子输出 骑士的走法(遍历棋盘的所有格子)注意方向:constintdx[8]={ -2,-2, -1, 1,2, 2, 1,-1};constintdy[8]={ -1, 1, 2, 2,1,-1,-2,-2};输入输入 n ( 1< = n < = 10 ) 代表棋盘的规模就是 n*n 的规模,骑士永远从 (1,1) 出发,

2021-03-30 23:05:03 2378 1

原创 1530-数的划分(深搜+剪枝)

目录描述输入输出代码实现思考描述将整数n分成k份,且每份不能为空,问有多少种不同的分法。当n=7,k=3时,下面三种分法被认为是相同的: 1,1,5.1,5,1; 5,1,1输入—行两个数n ,k。n<210输出—行—个整数,即不同的分法数。代码实现#include<bits/stdc++.h>using namespace std;int n,k,c;void dfs(int x,int ans,int sum){ if(sum==n&&ans

2021-03-28 22:58:34 193

原创 1060-第二章:我们都有梦想

描述林静究竟在忙什么?暑假没有回家,现在打电话到他宿舍总是不在,郑微通过他的舍友给他留了自己的电话,也不见他回复。明明上火车的前两天郑微还跟林静通过电话,他在那一头答应得好好的,等她到了广州,他就会带她到处去玩,吃遍广州的小吃,当时郑微没有感觉到丝毫的异样,就连他的笑声也是一如既往地带着她熟悉的宠溺和宽容。  可是现在郑微没忘记两人的约定,林静却踪影全无。难道是她打错了电话?不可能!那个电话她倒着也能背出来,何况那边接电话的舍友明明也是认得林静的,只是说他不在。  不在不在,老是不在!还说是个模范好学

2021-03-17 23:02:06 87

原创 算法训练 数的划分

目录题目描述输入输出输入样例输出样例代码实现思考题目描述一个正整数可以划分为多个正整数的和,比如n=3时:3;1+2;1+1+1;共有三种划分方法。给出一个正整数,问有多少种划分方法。输入一个正整数n输出一个正整数,表示划分方案数输入样例3输出样例3代码实现#include<iostream>using namespace std;int const Max = 1e2+5; int dp[Max][Max];int main(){ int n; ci

2021-03-14 22:53:36 126

原创 1526水池数目

目录题目描述输入输出输入样例输出样例代码实现思考题目描述有一些小草和一些湖泊,现在,我们把它们通一看成水池,假设有一张某处的地图,这个地图上仅标识了此处是否是水池,现在,你的任务来了,请用算出该地图中共有几个水池。‘#’表示湖泊‘*’表示小草输入单组数据输入第一行两个数n和m,地图的行数n(0<m<100)与列数m(0<n<100)然后,输入接下来的n行每行输入m个数,表示此处有水还是没水(#表示此处是水池,*表示此处是小草)输出输出该地图中水池的个数。要注意,

2021-03-08 22:57:25 105

原创 算法训练 安慰奶牛(kruskal+并查集)

目录问题描述输入格式输出格式样例输入样例输出数据规模与约定代码实现思考问题描述Farmer John变得非常懒,他不想再继续维护供奶牛之间供通行的道路。道路被用来连接N个牧场,牧场被连续地编号为1到N。每一个牧场都是一个奶牛的家。FJ计划除去P条道路中尽可能多的道路,但是还要保持牧场之间 的连通性。你首先要决定那些道路是需要保留的N-1条道路。第j条双向道路连接了牧场Sj和Ej(1 <= Sj <= N; 1 <= Ej <= N; Sj != Ej),而且走完它需要Lj的时间。

2021-03-03 22:08:51 138 2

原创 算法训练 --- 结点选择(搜索+动态规划)

目录问题描述输入格式输出格式样例输入样例输出样例说明代码实现思考问题描述有一棵 n 个节点的树,树上每个节点都有一个正整数权值。如果一个点被选择了,那么在树上和它相邻的点都不能被选择。求选出的点的权值和最大是多少?输入格式第一行包含一个整数 n 。接下来的一行包含 n 个正整数,第 i 个正整数代表点 i 的权值。接下来一共 n-1 行,每行描述树上的一条边。输出格式输出一个整数,代表选出的点的权值和的最大值。样例输入51 2 3 4 51 21 32 42 5样例输出12

2021-03-01 21:56:57 181

原创 1033 旧键盘打字 (20 分)

目录题目描述输入格式:输出格式:输入样例:输出样例:代码实现思考题目描述旧键盘上坏了几个键,于是在敲一段文字的时候,对应的字符就不会出现。现在给出应该输入的一段文字、以及坏掉的那些键,打出的结果文字会是怎样?输入格式:输入在 2 行中分别给出坏掉的那些键、以及应该输入的文字。其中对应英文字母的坏键以大写给出;每段文字是不超过 10​5​​ 个字符的串。可用的字符包括字母 [a-z, A-Z]、数字 0-9、以及下划线 _(代表空格)、,、.、-、+(代表上档键)。题目保证第 2 行输入的文字串

2021-02-24 22:24:04 97

原创 1030 完美数列 (25 分)

目录题目描述输入格式输出格式输入样例输出样例代码实现思考题目描述给定一个正整数数列,和正整数 p,设这个数列中的最大值是 M,最小值是 m,如果 M≤mp,则称这个数列是完美数列。现在给定参数 p 和一些正整数,请你从中选择尽可能多的数构成一个完美数列。输入格式输入第一行给出两个正整数 N 和 p,其中 N(≤10的5 )是输入的正整数的个数,p(≤10的​9)是给定的参数。第二行给出 N 个正整数,每个数不超过 10的​9​​ 。输出格式在一行中输出最多可以选择多少个数可以用它们组成一个完美

2021-02-13 22:48:20 66

原创 1029 旧键盘 (20 分)

目录题目描述输入格式输出格式输入样例输出样例代码实现思考题目描述旧键盘上坏了几个键,于是在敲一段文字的时候,对应的字符就不会出现。现在给出应该输入的一段文字、以及实际被输入的文字,请你列出肯定坏掉的那些键。输入格式输入在 2 行中分别给出应该输入的文字、以及实际被输入的文字。每段文字是不超过 80 个字符的串,由字母 A-Z(包括大、小写)、数字 0-9、以及下划线 _(代表空格)组成。题目保证 2 个字符串均非空。输出格式按照发现顺序,在一行中输出坏掉的键。其中英文字母只输出大写,每个坏键只输

2021-02-13 22:40:16 47 1

原创 1028 人口普查 (20 分)--错误测试样例分析

目录题目描述输入格式输出格式输入样例输出样例代码实现思考题目描述某城镇进行人口普查,得到了全体居民的生日。现请你写个程序,找出镇上最年长和最年轻的人。这里确保每个输入的日期都是合法的,但不一定是合理的——假设已知镇上没有超过 200 岁的老人,而今天是 2014 年 9 月 6 日,所以超过 200 岁的生日和未出生的生日都是不合理的,应该被过滤掉。输入格式输入在第一行给出正整数 N,取值在(0,10​5​​ ];随后 N 行,每行给出 1 个人的姓名(由不超过 5 个英文字母组成的字符串)、

2021-02-04 23:07:11 169

原创 1027 打印沙漏 (20 分)

目录题目描述输入格式输出格式输入样例输出样例代码实现思考题目描述本题要求你写个程序把给定的符号打印成沙漏的形状。例如给定17个“*”,要求按下列格式打印***** *** * ********沙漏形状”,是指每行输出奇数个符号;各行符号中心对齐;相邻两行符号数差2;符号数先从大到小顺序递减到1,再从小到大顺序递增;首尾符号数相等。给定任意N个符号,不一定能正好组成一个沙漏。要求打印出的沙漏能用掉尽可能多的符号。输入格式输入在一行给出1个正整数N(≤1000)和一个符号,中间以空格分

2021-02-04 22:58:02 95

原创 1025 反转链表 (25 分)

目录题目描述输入格式输出格式输入样例输出样例代码实现思考题目描述给定一个常数 K 以及一个单链表 L,请编写程序将 L 中每 K 个结点反转。例如:给定 L 为 1→2→3→4→5→6,K 为 3,则输出应该为 3→2→1→6→5→4;如果 K 为 4,则输出应该为 4→3→2→1→5→6,即最后不到 K 个元素不反转。输入格式每个输入包含 1 个测试用例。每个测试用例第 1 行给出第 1 个结点的地址、结点总个数正整数 N (≤10​5​​ )、以及正整数 K (≤N),即要求反转的子链结点的

2021-02-04 22:49:22 96

原创 1024 科学计数法 (20 分)--模拟

目录题目描述输入格式输出格式输入样例输出样例代码实现思考题目描述科学计数法是科学家用来表示很大或很小的数字的一种方便的方法,其满足正则表达式 [±][1-9].[0-9]+E[±][0-9]+,即数字的整数部分只有 1 位,小数部分至少有 1 位,该数字及其指数部分的正负号即使对正数也必定明确给出。现以科学计数法的格式给出实数 A,请编写程序按普通数字表示法输出 A,并保证所有有效位都被保留。输入格式每个输入包含 1 个测试用例,即一个以科学计数法表示的实数 A。该数字的存储长度不超过 9999

2021-02-03 23:11:04 176

原创 1020 月饼 (25 分)

目录题目描述输入格式输出格式输入样例输出样例、代码实现思考题目描述月饼是中国人在中秋佳节时吃的一种传统食品,不同地区有许多不同风味的月饼。现给定所有种类月饼的库存量、总售价、以及市场的最大需求量,请你计算可以获得的最大收益是多少。注意:销售时允许取出一部分库存。样例给出的情形是这样的:假如我们有 3 种月饼,其库存量分别为 18、15、10 万吨,总售价分别为 75、72、45 亿元。如果市场的最大需求量只有 20 万吨,那么我们最大收益策略应该是卖出全部 15 万吨第 2 种月饼、以及 5 万吨第

2021-02-02 23:27:50 65 1

原创 1019 数字黑洞 (20 分)--错误测试样例分析

目录题目描述输入格式输出格式输入样例输出样例代码实现题目描述给定任一个各位数字不完全相同的 4 位正整数,如果我们先把 4 个数字按非递增排序,再按非递减排序,然后用第 1 个数字减第 2 个数字,将得到一个新的数字。一直重复这样做,我们很快会停在有“数字黑洞”之称的 6174,这个神奇的数字也叫 Kaprekar 常数。例如,我们从6767开始,将得到7766 - 6677 = 10899810 - 0189 = 96219621 - 1269 = 83528532 - 2358 = 617

2021-02-02 23:18:24 289

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除