西南叶孤城-CSDN博客

原创 vscode远程调试Linux开发机上的C++程序

然而不同语言的dubug是不一样的，一般区分为编译型语言和解释型语言，编译型语言比如C++/C及Java等，其程序是编译成一个可执行程序后再执行。可以直接在IDE上进行调试。需要注意的是，远程调试需要确保网络连接稳定和服务器配置良好，同时需要考虑程序运行时的状态和调试方法，以便快速解决问题。**注意：**把配置文件中program项的${workspaceFolder}/a.out改为Linux上程序的目录，如我机器上的调试程序目录为/root/2023_study/C++_code/test。

2023-02-28 10:06:03 1395

原创 C++函数使用的几种方式

C++中函数的几种调用方式

2023-02-16 21:24:04 541

原创 C++实现线程池

多线程编程中，有很多线程处理同样的任务，频繁的创建和销毁线程对系统开销、性能都不友好。利用生产者消费者的思想的，可以把要处理的任务放到一个队列缓冲区里，主线程往缓冲区中队列中添加任务，而工作线程则从队列中取出任务来处理。两种方式需要注意的一点是，线程回调函数的区别，方式一使用普通的phtread_create,作为回调的成员函数要声明为static，避免多传一个this指针。两种实现方式，因为多线程涉及到线程间的互斥和同步，这里采取两种实现方式，实现方式一采用Linux提供的互斥锁和信号量。

2022-11-21 11:30:18 788

原创 C++开发服务器部署深度学习NLP、CV模型提供在线推理功能

基于C++实现Webserver服务器并部署深度学习模型提供在线推理功能。基于epoll、线程池、定时器等技术实现Webserver服务器，支持并发、解析http请求、支持请求深度学习模型推理结果。

2022-10-31 10:09:14 916 1

原创春招实习经历、nlp研究生求职C++后端

暑期实习面试经历、nlp调参选手转战c++

2022-05-04 12:48:26 1335

原创 Linux学习入门

Linux学习入门

2022-04-01 16:27:17 2386

原创刷题算法总结

刷题算法总结2022年3月17日下午作为一个打了8000把英雄联盟的帅哥，总结一下至今的一些刷题经验以此迎接晚上的网易笔试one 贪心算法这是一种考虑局部最优的算法，一般来说是在遍历过程来选取当前最优的操作。贪心算法可能得到全局最优，这要求其局部最优的结果互相不干扰。case:一般在解题过程中需要对序列进行按某种条件排序，之后遍历序列选择当前最优的操作。其中经常出现的区间贪心，按左或右端点排序后，之后进行贪心选择。two 双指针1、两个指针在序列中维护一个区间，也称滑动窗口。2、快慢指

2022-03-17 17:24:52 1465

原创 pytorch苏神的全局指针实现，用于实体识别或事件抽取的span方式

苏神的全局指针torch实现，用于实体或事件的span片段抽取

2021-12-21 11:13:51 2047 8

原创大规模未标记的文本数据分类处理baseline

一、问题介绍这里是华为的一个文本分类比赛，数据量大，而且有很多文章并没有标记类别。基础数据集包含两部分：训练集和测试集。其中训练集给定了该样本的文章质量的相关标签，测试集用来测试模型的标签预测准确率，该文本分类的难点主要有两个，一、文章的长度比较长，属于长文本分类，而Bert的最大输入只有512.二、训练集中有大量的未标记数据，而且还包含了“类别”为其他的文本，但是没有标记出来。所以对测试集分类的时候，也要考虑文章类别为“其他”的情况。以下给出训练集中标签和文本数量的数据情况，’ ‘表示未标记数据，对

2021-09-05 17:12:04 2045 3

原创使用Bert_BiLSTM_CRF进行实体或事件序列标注、获取微调后的Bert词向量

序列标注任务现在很多自然语言处理的任务都被视为基于神经网络的序列标注任务，如实体识别和事件抽取这两个信息抽取中的子任务，序列标注任务就是通过训练和基于概率对文本的每一个字符打上对应的标签，我们就可以对我们想要识别出的文本部分打上特定的标签，可以看成一种编码和解码，自然语言处理的任务跟通信模型非常类似，很多模型都是对文本进行编码之后再解码就能得到对应结果。本文介绍的是基本的Bert_BiLSTM_CRF的序列标注，其中的Bert是预训练语言模型，主要用来获取文本对应的向量，Bert是在大规模的文本语料上训

2021-09-02 11:51:23 5386 3

原创 Bert超长文本分类、文本摘要

Bert大规模超长文本分类长文本分类文本摘要算法Textrank介绍句子相似度计算训练全部代码标题总结长文本分类文本分类是把文本打上对应的类别标签，在互联网中的应用场景很多，如评论、弹幕等。作为比较强大的预训练模型Bert，用来做文本分类有很好的效果。本文介绍pytorch版本的Bert长文本分类,但由于Bert的输入长度有现在，最长只能输入512个字符，但长文本通常有几千或者几万个字，所以本文采用了两种策略来进行长文本分类，一是取文本开头的512字符输入到Bert，二是对文本先采用文本摘要算法，得到重

2021-09-01 11:49:31 6432 13

原创编程算法，语言入门

一、关于在线判题系统oj的使用。我使用的是中南的两个学长弄的pipioj，题目都很经典，数据结构与算法，字符串，暴力，搜索，贪心，dp的题都很全。考虑到有同学之前没有接触过OJ，这里对OJ进行一些介绍，OJ是做编程练习的网站，我用的是中南的大佬做的pipioj，网址http：//pipioj.online/,大家可以注册自己的账号。可以在问题列表选择要做的题目，在本地IDE(Devc++,CodeBlocks)进行编码调试，之后再进入相应题目的提交页面，选择所用的编程语言进行提交。一般来说支持C

2021-01-20 17:37:19 219

原创 C++编程基础

C++编程基础万能头文件#include<bits/stdc++.h> 中包括了C++中很多库，基本上可以满足编程中用的库调用。一、语言入门、简单模拟万能模板：#include<bits/stdc++.h>using namespace std;int main(){ printf("hello world!\n"); return 0;}多组读入：while(scanf("%d%d",&n,&s)!=EOF){ int

2020-12-29 20:43:46 347

原创事件抽取

事件抽取综述一、研究背景信息时代背景下，随着互联网的发展，商业部门、政府机构以及个人正面对着越来越多与工作、生活密切相关的文本信息，而如何从这些大量文本中挖掘潜在的有使用价值的信息，仍是一个难题。信息抽取（Information Extraction）研究正是在这种大的应用背景下应运而生的。“信息抽取任务的本质是从无结构的自然文本中识别出事实描述（包括：实体、关系、事件），并抽取出与这些事实描述相关的信息，以结构化的形式存储，供用户查询以及供研究人员进一步分析利用。二、研究意义自然语言理解是人工智能

2020-12-28 10:06:15 627

原创 Codenewbee学习计划

# 学习目标： NLP与Linux下C++后台学习目标学习内容：学习安排：目前总结：欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入大啊打打打打打打学习内容：1、了解NLP基础知识

2020-12-24 10:12:57 108

weixin_44305190的博客