B站：阿里武-CSDN博客

原创【计算机考研】初试出成绩前应该做的6件事

这一段时间指的是什么时间呢？就是考完初试后，没考复试前复试之后干啥？复试以及过了一周，离出初试成绩还有一段时间，这段时间我们就是一直玩到出成绩在复习吗？你可能会想，出成绩前复习，要是没过初试岂不是白搞了，当然有这种观念的同学也应当是小数目吧。毕竟大家考研还是想着上岸，这段时间肯定不能浪费，所以这段时间我们应该做些什么？我的建议自我方向这一步必然是最先做的，因为他相当于给你自己定一个主基调，这个问题你必须先想清楚，因为这也是为后面选导师等进行服务的。科研型：对计算机研究领域感兴趣

2021-01-15 21:37:17 560

原创 408真题和模拟题应该怎么刷

今天分析一下咱们408真题和模拟题应该怎么刷，以及一些经验，以上的经验是基于一位408大佬（408 120+ 总分390+）以及我的一些经验和看法，废话不多说，下面进入正题咯时间安排408大佬之前给的时间规划如下：真题共分为3轮（做三遍），其中第一轮开始时间是国庆前后，然后按照你个人的进度进行三轮后，大概12月份开始刷模拟题。以上是一个参考真题刷法第一轮第一轮主要是：全真模拟 + 订正 + 王道巩固其中全真模拟不用多说，就是在固定的考试时间内完成真题，然后进行打分，这个打分也是一

2020-10-08 16:48:18 7183

原创考研英语二81分复习经验分享|资料推荐|复习方法|复习规划

前言在复习经验方法之前，首先说明一下我的个人情况，我英语二分数为81分，也不是一个特别高的分数，但是对于你冲985、211分数还是够用的，而且对于一些学校，你的考研分数高的话，可以进行英语课程免修，留出更多的时间来做科研。（中大75分以上即可申请免修）复习过程我的数学和英语的复习时间算是比较早的，我2月份就开始在进入到复习之中，但是前面的时间并不是完全用来复习，而是并行地进行（毕竟还是有课程）。在2月份的时候，我就已经搜集各种各样的考研英语经验题来进行一个时间规划，以及如何去进行有效的复习。2

2020-07-22 17:28:07 8746

原创计算机考研初试经验分享|408经验分享

初试经验本来是没有打算做一个初试经验的，但是鉴于很多小伙伴都问了很多关于408方面的复习经验，虽然我的408分数不高，没有120分大佬那么厉害，但总体还是有一些经验的（关于规划方面），不至于大家在复习时晕头转向，这里总结一些经验给大家。408 经验对于所有的同学，我强烈建议你们最晚408从7月份就可以开始准备了，不要太晚（对于科班来说也是一样的， 408内容多），当你们看到这个经验之后，也是7月多份了，尽快的开始准备了！！当然，如果你是三四月份看到这条经验的话，那么你有较充足的时间去把王道的书和教

2020-07-05 16:09:35 12556 2

原创 2020年中山大学计算机专硕复试逆袭经验帖

复试总结在正文之前，博主先说一下我的初试情况，今年报考的是计算机技术的专硕，总分350分，排名145，复试431分，最终排名78。计算机一共招收79人，扩招30人，一共招109人，目前已拟录取。也算是逆袭成功吧。由于今年情况特殊，由线下面试改为线上面试，所以有一些考试形式发生了变化，而我会对线上面试和线下面试两种方式都进行复试的一些经验介绍。不过还要多说一句，其实复试也打一个信息差，你需要做的就是尽可能的去找到一些信息点，包括看到我的博客，联系中大的师兄等。往年线下复试经验一般来说往年的复试成

2020-06-01 16:40:25 8772 7

原创大模型推荐词生成——Generating Query Recommendations via LLMs 【阅读笔记】

主要去进行query的相关搜索补充；例如我们引入生成查询推荐（GQR）系统。GQR以大语言模型为基础，利用大语言模型的提示能力，通过提示中提供的几个例子（检索或手工）来理解推荐任务。

2024-08-23 17:49:55 847

原创一文贯通LLM推理相关知识【上下文长度、量化、模型大小】

Int4量化模型与float16模型相比，精度损失在 1 - 2 个百分点左右。（Yi模型与Baichuan2模型有类似的结论）Int8量化模型性能与float16格式差别不大。vllm最方便使用适合操作。8 常见LLM用GPU参考。

2024-08-23 10:58:18 3314

原创 NCCL报错 Bootstrap : no socket interface found 解决

【代码】NCCL报错 Bootstrap : no socket interface found 解决。

2024-03-19 16:13:44 3214

原创 deepspeed 报错 up NCCL communicator and retreiving ncclUniqueId from [0] via c10d key-value store 解决

2. 设置正确的NCCL_SOCKET_IFNAME。使用deepspeed的时候报错。

2023-11-14 21:17:11 5126

原创【论文笔记】Large Search Model: Redefining Search Stack in the Era of LLMs

现代搜索引擎是建立在不同组件的堆栈上的，包括查询理解、检索、多阶段排序和问答等。这些组件通常被独立地进行优化和部署。在本文中，我们引入了一个新颖的概念框架，称为大型搜索模型，通过将搜索任务与一个大型语言模型（LLM）统一起来，重新定义了传统的搜索堆栈。所有任务都被定义为自回归文本生成问题，通过使用自然语言提示来定制任务。这个提议的框架利用了LLM的强大的语言理解和推理能力，提供了提高搜索结果质量的潜力，同时简化了现有繁琐的搜索堆栈。

2023-11-12 20:20:39 344 1

原创用神经网络进行回归预测 weight_decay为异常值（大于1 的值）模型效果好的原因解析

weight_decay越大越好的原因研究发生的问题特此记录之前在用神经网络来做一个回归问题，回归的数值范围是0~1之间。然后进行网格搜参（搜索最好的weight_decay和学习率）的时候发现一个不合常理的现象，就是一般往往最好的weight_decay 一般是很小的一个数值（0.001或者0.0001），但是我的最优weight_decay反而很大，这就给我造成很大的困扰，还好经过一番探索，最终锁定了问题，下面我将一一道来现象发现weight_decay 取得一个比较大的值的时候模型效果最好

2022-03-15 15:25:08 5389 1

原创 TEASEL: A Transformer-Based Speech-Prefixed Language Model 论文阅读

前言好吧我又来更新sota 论文了这个是多模态情感分析的sota 而且和第二名相差很大。摘要多模态语言分析是NLP的一个新兴领域，旨在同时建模说话人的单词语义、语音和面部表情。在这方面，语义通常优于其他模态，因为它们是通过基于Transformer的模型在大型语料库上预先训练的。尽管他们的表现很好，但由于数据不足，在任何模型上训练一个新的自监督学习（SSL）Transformer通常是不可能实现的，这在多模态语言学习中就是如此。这项工作提出了一个基于Transformer的语音前缀语言模型，

2021-11-08 23:17:18 1881 18

原创 CM-BERT: Cross-Modal BERT for Text-Audio Sentiment Analysis 阅读笔记

前言多模态情感分析是一个新兴的研究领域，旨在使机器能够识别、解释和表达情感。通过跨模态交互，我们可以得到说话人更全面的情感特征。（BERT）是一种有效的预训练语言表示模型。然而，以往的研究大多只基于文本数据，如何通过引入多模态信息来学习更好的表示仍然值得探索。在本文中，我们提出了跨模态的BERT（CM-BERT），它依赖于文本和音频模态的交互来微调预先训练好的BERT模型。作为CM-BERT的核心单元，, masked multimodal attention 通过结合文本信息和音频模态信息来动态调整单

2021-11-08 22:38:33 2279 2

原创 Transformer 参数量计算

参考https://blog.csdn.net/weixin_43922901/article/details/102602557前言参考文献从论文本身出发进行分析，算出了Transformer参数量，但是也需要从源码实现来进行分析Transformer 源码class ScaledDotProductAttention(nn.Module): def __init__(self): super(ScaledDotProductAttention, self).__ini

2021-10-19 11:07:57 6647

原创【LeetCode】215. 数组中的第K个最大元素

快排class Solution {public: void back (vector<int>& nums, int left, int right, int k) { if (left >= right) { return; } int i = left, j = right, base = nums[left], tmp = 0; while (i &lt

2021-09-14 12:55:55 272

原创【手把手】如何使用置信学习cleanlab对数据集进行去噪

前言在做一个项目的时候，发现数据集噪声非常多，项目是是一个文本分类问题，但是数据集中经常出现 label 错误的情况，也就是所谓的label noise问题，在这样的数据集对模型进行训练效果非常差。关于label noise感兴趣可以看 Noisy Label 20 篇论文纵览，也是一个研究的热门方向，且对于工业界意义很大。笔者在经过一些相关的调研之后，从实现难度，教程数量，原理理解这些方面角度，最终选取置信学习这种方式对数据集合进行去噪置信学习相关介绍那什么是置信学习呢？这个概念来自一

2021-09-08 10:51:02 10068 21

原创阅读笔记 Incremental Few-shot Text Classification with Multi-round New Classes: Formulation, Dataset and

阅读笔记 Incremental Few-shot Text Classification with Multi-round New Classes: Formulation, Dataset and System前言在训练一个文本分类模型对时候，通常是在一个预先处理好的固定类别的数据集中，但是在实际应用中，文本的类别是不断变化的，可能会出现一批新的类别和对应的样本，这就要求模型能够通过只通过一些新的样本集，来准确识别新加入的类，我们定义这种任务为：incremental few-shot t

2021-09-08 10:47:00 472

原创 Multimodal Routing: Improving Local and Global Interpretability of Multimodal Language Analysis阅读笔记

文章目录Multimodal Routing: Improving Local and Global Interpretability of Multimodal Language Analysis模型结构encodingRoutingPrediction实验Interpretation AnalysisMultimodal Routing: Improving Local and Global Interpretability of Multimodal Language Analysis任务：多模

2021-05-09 11:42:25 752

原创阅读笔记 MISA: Modality-Invariant and -Specific Representations for Multimodal Sentiment Analysis

文章目录1.前言2.模型结构2.1 Modality Representation Learning2.1.1 Utterance-level Representations2.1.2 Modality-Invariant and -Specific Representations2.2 Modality Fusion2.3 Learning2.3.1 Similarity Loss2.3.2 Difference Loss2.3.3 Reconstruction Loss2.3.4 Task Loss3.

2021-03-22 13:13:24 4027 2

原创 Infusing Multi-Source Knowledge with Heterogeneous Graph Neural Network for Emotional 阅读笔记

文章目录1. 前言2. 模型结构2.1 Heterogeneous Graph-Based Encoder2.1.1 Graph Construction2.1.2 Graph Initialization2.1.3 Heterogeneous Graph Encoding2.1.4 Emotion Predictor2.2 Emotion-Personality-Aware Decoder3. 实验3.1 损失函数3.2 模型结果4. 总结4.1 模型贡献1. 前言情感对话系统的成功取决于对情感的

2021-03-17 20:56:41 909

原创 A Novel Graph-based Multi-modal Fusion Encoder for Neural Machine Translation阅读笔记

文章目录1. 前景介绍2. 模型结构2.1 编码器2.1.1 Multi-modal Graph2.1.2 Embedding Layer2.1.3 Graph-based Multi-modal Fusion Layers模态内融合**模态间融合**2.2 解码器3. 实验结果4. 模型评价4.1 模型的贡献1. 前景介绍这篇文章讲的是多模态机器翻译首先把图和句子用一个统一多模态图来表示图结构如下每个结点包含，文本信息和图片信息图有两种边，一种是相同模态相连的边，一种是不同模态相连

2021-03-17 20:53:27 1217 2

原创 Bi-modal first impressions recognition using temporally ordered deep audio and stochastic 阅读笔记

Bi-modal first impressions recognition using temporally ordered deep audio and stochastic visual features.本文提出了两种双模态深度神经网络架构，它们具有两个分支，一个分支用于提取音频特征，另一个分支用于提取视觉特征。在预处理原始视频数据之后，会生成模型的音频和视觉分支的输入。从两个分支提取的特征将进行融合，整个网络则是端到端训练的。数据预处理一个视频被分成多个不重叠的部分（子视频），对于每个

2021-02-24 14:34:48 497 1

原创 Multimodal First Impression Analysis with Deep Residual Networks 阅读笔记

Multimodal First Impression Analysis with Deep Residual Networks前言这篇文章也算是一个老文章了，不过效果也非常好，准确率也在前三名之内，有必要读读它的模型结构以及特征方法，特别是他对于声音提取的方面好像有一些小创新，虽然是两个模块，但也有借鉴意义，模型结构以下是整个模型的一个流程图，通过，训练集进行训练得到一个模型，然后把被测试者的视频输入到模型中，得到它的个性分数以及是否是一个好的面试者（通过还是不通过）Audiovisual　模

2021-02-24 14:31:33 535

原创 A Personality traits and job candidate screening via analyzing facial videos 阅读笔记

A Personality traits and job candidate screening via analyzing facial videos前言这篇文章看起来对个性的提取的话，只提取了一个脸部特征，但是效果也不错，我们可以看到它的提取的脸部的人是如何提取的以及它的分类方法，从摘要中我们可以看到它是使用了支持向量机的回归，这种比较传统的回归方法。模型方法模型的整个流程如下图所示，总共包含三个方面，第1个是视觉特征提取，然后是个性回归，最后是面试分类，脸部预处理使用 Haar cas

2021-02-24 14:28:51 766

原创 Multi-modal Score Fusion and Decision Trees for Explainable Automatic Job Candidate Screening 阅读笔记

Multi-modal Score Fusion and Decision Trees for Explainable Automatic Job Candidate Screening from Video CVs这篇文章作为2017年的文章，其准确率非常之高，到2020年也只有一篇超过了它的准确率，所以我们确实需要去看一看这一篇的特征提取方法，以及它所用的融合方法和一些其他的结构模型结构视觉特征提取脸部特征对每一帧，使用人脸对齐方法 Supervised Descent Method，提取

2021-02-13 21:07:49 878

原创 Multimodal analysis of personality traits on videos of self-presentation and induced behavior 阅读笔记

虽然这篇论文的投的期刊IF不是很高，但仍有一些值得学习和借鉴的地方，2020年的最新多模态情感分析1.模型结构1.1 面部特征特征提取用OpenFace 提取68个脸部的坐标点，脸部边界（20），眼睛眉毛（22），鼻子（9），嘴巴（20）然后对坐标点进行线性的变换，把它规划，去掉旋转角度、平移角度，得到面部的正脸照片。resize到224*224建模对生成的连续的人脸照片进行建模，使用两种模型结构：ResNeXt网络CNN-GRU网络其中CNN是AlexNet,模型结构如图

2021-02-10 11:14:50 919 2

原创 Gated Mechanism for Attention Based Multi Modal Sentiment Analysis 阅读笔记

GATED MECHANISM FOR ATTENTION BASED MULTIMODAL SENTIMENT ANALYSIS 阅读笔记最近在跟进多模态的情感分析发现多模态榜一又被刷下来了，这篇论文是当前时间内的最好的效果，下面就对论文的模型结构以及实验细节，和我自己的心得来做一个笔记。读完这篇文章不得不说这篇论文在篇幅只有5页的情况下，把问题说得非常清楚，他的写作方法也值得我们学习！！！推荐一个好地址： paperwithcode 的 sota 榜，很方便找代码的。https://papers

2021-02-07 20:43:38 1930 7

原创 python MTCNN 人脸识别教程配置+代码实例远离踩坑

1. github地址https://github.com/ipazc/mtcnn2. 安装Currently it is only supported Python3.4 onwards. It can be installed through pip:$ pip install mtcnnThis implementation requires OpenCV>=4.1 and Keras>=2.0.0 (any Tensorflow supported by Keras will

2021-02-05 14:36:04 2781

原创【leetcode】86. 分隔链表详解

86. 分隔链表解题思路暴力解法扫描链表把小于x的队列依次加入到 arr1 ，大于等于的加入到 arr2然后在dummy 结点依次加入arr1 arr2复杂度分析时间复杂度 O(N)空间复杂度O(N)代码vector <int> arr1, arr2;ListNode * dummy = new ListNode(-1) ;ListNode *end = dummy;while (head != nullptr) { if (head-&g

2021-01-23 09:49:26 358

原创【leetcode】2. 两数相加详解

2. 两数相加解题思路设置哑结点，插入适当结点左边到右边都是个位数开始，所以进行模拟加法即可得到位数值注意：当指针指向空时我们认为此时值为0 便于处理进行加法模拟特殊情况分析当两边结点扫描完需要加入新结点时例子250 + 750，需要多加1位最高位复杂度分析空间复杂度 O(1)时间复杂度 O(N)代码/** * Definition for singly-linked list. * struct ListNode { * int val;

2021-01-22 23:09:21 494

原创【leetcode】92. 反转链表 II

反转链表 II解题思路设置哑结点前面0 ~ m-1个进行尾插法中间m-1 ~ n 进行倒叙尾插法最终连接第n + 1 个复杂度分析空间复杂度 O(1)时间复杂度 O(N)代码/** * Definition for singly-linked list. * struct ListNode { * int val; * ListNode *next; * ListNode() : val(0), next(nullptr) {} *

2021-01-22 22:29:35 276 1

原创【leetcode】24. 两两交换链表中的节点

前言有些同学也许会被链表指针给搞的昏头转向，在纸上画出很久都没搞清楚。下面将介绍一种较为通用的方法：“新建链表法”，可以解决指针乱指等晕头转向的操作。只要掌握删除节点和尾插法建表，大部分链表题目都可以转换为重新建表问题“新建链表法”：即使用尾插法构建“新链表”，此处不是从新malloc链表节点，而是改变原节点的指针指向。其步骤如下：根据问题需求判断头节点是否会被改变，若有则在原链表上加上哨兵节点作为「虚拟头节点」。遍历原链表节点，把符合题意的节点“拆下来”，然后追加到“新链表”上。“新链表”

2021-01-20 21:03:36 245

原创【leetcode】80. 删除排序数组中的重复项 II

题解1思路 # 定义两个指针 p q 一个记录当前重复次数的变量 maxLen = 1 表示还可以重复几次 # 对数组进行遍历 # 如果nums[p] == nums[q] ： # if maxLen == 0： # continue # else： # maxLen– # 对p进行修改 # 否则 # 重置maxLen 为 1 #

2021-01-19 20:48:49 259

原创【leetcode】26 删除排序数组中的重复项

解法1：时间复杂度 O(n ^2)空间复杂度 O(1)class Solution {public: int removeDuplicates(vector<int>& nums) { // # 定义一个特殊值和长度值 // # 一步步遍历，如果找到特殊值则跳过 // # 否则将新值插入到长度值位置长度值+1 // if (nums.size() == 0) {

2021-01-19 19:32:25 247

原创阅读笔记 M3ER: Multiplicative multimodal emotion recognition using facial, textual, and speech cues

M3ER: Multiplicative multimodal emotion recognition using facial, textual, and speech cues模型总体结构我们使用三种模态特征，即语音，文本和面部特征。、流程如下：提取特征以从原始输入is，if和if（紫色框）中获取fs，ft，ff。检查特征向量是否有效。我们使用指标函数Ie来处理特征向量（黄色框）。将这- 些向量传递到M3ER的分类和融合网络中，以预测情绪（橙色框）。在判断是否有效时，

2021-01-14 21:08:20 1473 2

原创阅读笔记 A Deep Multi-Level Attentive network for Multimodal Sentiment Analysis

前言论文讲的是两个模态的情感分析，作者提出一个网络，此网络通过在多个层次上引入注意力，从视觉和文本中产生区分性特征。通过利用视觉数据中的通道channel注意力和空间注意力来获得双注意力的视觉特征。总体来说用两个注意力 channel attention 和 spatial attention 注意力提高CNN 采集图像特征能力提出语义注意力模拟单词的图像区域与语义之间的相关性，也就是一个JOINT ATTENDED MULTIMODAL LEARNING的过程（联合多模态学习)

2021-01-14 13:21:04 1178

原创多模态阅读笔记 Noise Estimation Using Density Estimation for Self-Supervised Multimodal Learning

Noise Estimation Using Density Estimation for Self-Supervised Multimodal Learning这篇文件讲的是，按照现有多模态的任务，往往会出现噪音的问题，噪声使得模型一直得不到最好结果，而这篇文章提出一个去噪方法，自监督的去训练一个去噪模块来消除噪声，实验结果显示，用此方法，能够直接提高 VQA， Text-To-Video Retrieval 等任务的表现本文贡献证明多模态噪声的消除任务可以归结为多模态密度估

2021-01-12 22:26:25 1617 1

转载为什么神经网络有偏置？神经网络中的偏置（bias）究竟有这么用

转载地址https://www.zhihu.com/question/305340182/answer/721739423首先从线性方程的角度来看，假设简单的线性方程y= wx,当权重w= 1,2,3时，图形如下：不管权重怎么变换该方程所能拟合的场景都受制于原点（0,0）。当给这个方程加上截距后变成y= x + 1.方程的灵活性大大增加，拟合能力增强，所以提升了精度。在神经网络中，以sigmoid函数为例，加入偏置后也是增加了函数的灵活性，提高了神经元的拟合能力。在神经元中，output =

2020-12-31 16:06:23 6575

原创 Multi-modal Multi-label Emotion Detection with Modality and Label Dependence 阅读笔记

背景这篇文章讲的是多标签的情感分析，这篇文章是考虑多模态的情感分析，因为是多标签所以需要考虑不同标签的依赖性，以及每个标签对不同模态的依赖性任务的具体例子是：给定一个视频，包括三个模态信息（视觉，文本，声音）然后给出情感倾向（可以是多个）文章指出多标签分类比单标签分类要更加难，以主要挑战是如何去对标签之间的依赖性进行建模，正如上图所说，一个Sad 很有可能和Disgust 是同时出现的，但是有很小可能会出现 happy 和 sad。论文内容特征初步提取Text ：

2020-12-30 21:38:39 1609

原创 Multistage Fusion with Forget Gate for Multimodal Summarization in Open-Domain Videos 阅读笔记

介绍这篇文章是对一个长视频得到一个摘要，是属于多模态的论文.模型结构模型总体结构如图，还是非常易懂的经典双线程，其中两个模态有交叉（信息交换）的地方，模型总体还算简单特征初步提取videoResNeXt-101 3D convolutional neural network 提取视频的16帧，然后加入一个位置嵌入position embeddingstext使用两种方式每个单词使用 biGRU得到单词 embedding每个单词使用 bTrans

2020-12-29 23:23:14 792

c++封装的二叉排序树

c++ 封装二叉排序树私有成员函数递归非递归的插入实现的树的各种操作，并且利用c++的面向对象思想进行封装，内部包含三个文件BinaryTree.cpp， BinaryTree.hpp ， main.cpp 非递归的插入实现的树的各种操作，私有成员函数递归。

2017-04-24

c++封装的多项式加法器

利用c++封装，实现了多项式加法减法乘法求值求导求积分判断是否相等等操作，而且使用了文件操作，进行文件的读取。异常处理较好，程序健壮性不错

2017-04-25

matlab使用libsvm进行分类代码实例（带最新libsvm超详细安装教程）

matlab使用libsvm进行分类代码实例，这里包括一个数据集合，一个代码（包括详细注释），而且代码经过修改，已经符合最新的libsvm调用格式，不会出错，用于SVM分类。首先通过博客，安装好libsvm库，博客地址：https://blog.csdn.net/qq874455953/article/details/88782121，然后直接点击运行代码即可，同时你也可以添加数据集，然后更改一下矩阵参数就可以利用自己的数据集进行预测分类了，简单实用。

2019-03-28