笔记
文章平均质量分 65
YuCong Wang
这个作者很懒,什么都没留下…
展开
-
深度学习前沿技术摘要
目前的深度学习主要分为以下几个领域:图像领域(CV)representative task图像分类目标检测,目标跟踪,动作检测实例分割超分辨率(去马赛克)去雾去雪3D重建风格迁移OCR(光学字符识别)自然语言处理(NLP)文本分类文本标签实体抽取句法依存语义消歧情感分析机器翻译自然语言理解(NLU)观点分析意图提取/识别智能对话生成任务多模态(multimodal)其他:语音识别(AVR)针对这些领域以及其子任务,在深度学习蓬勃发展的前30几年(1987-原创 2021-12-02 09:44:26 · 2623 阅读 · 2 评论 -
【hadoop】伪分布式HBase的安装
1.配置环境变量(解压到/usr/local下)mv /usr/local/hbase-1.1.5 /usr/local/hbasevim ~/.bashrcexport PATH=$PATH:/usr/local/hadoop/sbin:/usr/local/hadoop/bin:/usr/local/hbase/binsource ~/.bashrc2.配置hbase-env.shvim /usr/local/hbase/conf/hbase-env.shexport JAVA_HOM原创 2020-12-24 12:07:30 · 284 阅读 · 0 评论 -
【爬虫】在云服务器上部署定时爬虫
准备环境:1.云服务器:centos72.docker安装 (可以参考我的其他文章)本来是准备用scrapy框架写的,但是发现目前还玩不转,只是部署就已经费劲死了,所以这次就准备做一个简陋版的23333正式开始(简陋版呜呜呜)1.先在本地写好爬虫的主文件。...原创 2021-11-05 00:43:25 · 1239 阅读 · 0 评论 -
人工神经网络应用研究报告
本次的报告将会从以下三个方面入手:人工神经网络的理论推导人工神经网络的历史人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型.按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。原创 2021-11-05 00:42:33 · 529 阅读 · 0 评论 -
R语言并行
R语言编程课堂任务:考察R语言的函数、循环、if条件句编程编写一个函数,函数的要求:➢ 对向量里的每一个元素进行y = 0.5x + 1的映射;➢ 如果0<y<=10则y1=1,10<y<=20或者y>40则y1=2,否则y1=3;➢ 最后函数返回y1;最后用函数计算向量为c(1:100)的映射值串行:...原创 2021-11-05 00:42:11 · 730 阅读 · 0 评论 -
安装spacy以及中英文模型
1.确保环境已经安装tf2x,cpuGpu无所谓python 3.8.8tf 2.4.1(cpu)安装spacy3.0.0pip install spacy==3.0.0离线下载zh_core_web_sm离线下载en_core_web_sm离线安装pip instal xxx原创 2021-11-05 00:41:51 · 466 阅读 · 0 评论 -
基于《Attention is all you need》论文复现的Transformer中英翻译模型的训练与推理
Transformer综述Transformer 原理与代码的构建首先看一下transformer的结构图:接下来我们将其j’k’k原创 2021-11-05 00:41:21 · 328 阅读 · 0 评论 -
自然语言处理的一些小知识点
除了jieba以外,还有没有其他的中文分词工具:Spacy V3.0一般的nlp流水线是怎样的文本 ——(预处理)——分词——词向量化——词性标注——语法解析——命名实体识别——文档3.预处理方式有哪些:去除停用词,数字等无用信息词性归一化词干提取词根提取词向量的表述Gensim1、tf(t) = 词语在文档中出现的频率IDE(t) = log(文档总数量 / 词语词语出现的文档的数量)TF-IDE(词频-反向文档频率) = TF * IDE(词语的常见程度,越大代.原创 2021-11-05 00:40:57 · 164 阅读 · 0 评论 -
腾讯音乐nlp算法实习生一面0806
首先招呼我的面试官他也说了他不是专门做nlp的,他是做音频的,第一阶段自我介绍没啥好说的,然后根据我的项目,因为我首先介绍的是一个cv的任务,有用到resnet做bonenet,所以问了下resnet的特点,以及为什么要引入残差链接。然后是看到我的简历上有写transformer做nmt,问了下对于对于transformer有什么改进,我说首先是将数据集替换,任务变成了中英文的翻译,使用了subword中的bpe模型做字词分割,我就说因为原文做的翻译任务使用的都是印欧语系,所以用同一张此表,但是中英原创 2021-08-06 12:15:24 · 282 阅读 · 0 评论 -
XtuningTheBert
Background: optimizer the bert model updating in 2021/10/18想想较低层次的问题,例如语料库中没有足够的标签,那么我们如何增加模型的准确性,诅咒,使用bert和其他微调结构,这意味着通过使用一些技巧。首先,改进基于文本分类任务或多文本分类任务的bert模型的方法主要有三种:Fine-tuning StrategiesFurther pretrainingMulti-Task Fine-tuning(from 《How to Fine-Tu原创 2021-11-05 00:35:55 · 367 阅读 · 0 评论 -
Bert-textcnn技术文档
文章目录BERT的详细介绍Bert历史----词向量技术与预训练范式的崛起早期Word Embedding从Word Embedding到ELMOBert的原理TextCNN的详细介绍TextCNN原理BERT+TextCNN联合使用介绍如何实现例子我们当前模型训练的方法(具体到,分了几个模型,每个模型数据及标签是怎么的,每个模型数据集是怎么拆分的,每个模型的训练参数怎么设置,每个模型训练情况是怎么样的)我们当前模型是如何测试(具体到,测试数据与训练数据存在什么差异,测试结果是怎么样的)BERT的详细介绍原创 2021-11-05 00:35:07 · 4235 阅读 · 1 评论 -
slowfast模型浅析
slowfast模型浅析业务场景SlowFast模型业务场景背景非常固定动作持续时间短.快SlowFast模型使用双流卷积输入,一个慢通道,一个快通道,分别提取空域信息以及时域信息。关键点:Slow Pathway:γ\gammaγ是采样步长,即将原始视频按照该步长取样,一般取16, 即16帧取一张关键帧,TTT是采样次数,即一共采样多少次。所以慢通道的一次输入总帧数为T×γT \times \gammaT×γFast Pathway:α是帧采样倍数,β是通道倍数\alpha是帧原创 2021-11-05 00:34:09 · 11327 阅读 · 1 评论 -
【不解决问题你打我】虚拟机与主机NATSSh问题(使用校园网)
简介:名词:NAT模式(网络地址转换)名词解释:百度用法场景:当局域网ip地址紧张或者不允许在局域网下有新的ip的时候,我的情况是在宿舍使用校园网的时候发现桥接网卡无法使虚拟机连上网络,因为校园网只允许一个ip,所以就只能使用NAT模式,就是主机与虚拟机共用一个ip,通过映射端口来走流量的一种操作。目前我只测试了windows平台,以后会添加macos平台的。操作环境主机:windows10专业版寄生机:centos7,unbuntu16.0/ubuntu18,0虚拟机软件:VirtualBo原创 2020-09-26 17:33:25 · 848 阅读 · 0 评论