自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(67)
  • 收藏
  • 关注

原创 邮储

为什么选择邮储行业 金融行业发展好,银行规范严谨的作风,发展前景广阔,企业 接地气、服务百姓、能让我们快速成长,邮储银行吸引我的是历史悠久,制度完善,能够提供更多成长的可能性。个人 职业发展,待遇(相比互联网公司挣得少,但是稳定) 离家近,更能照顾父母银行规范严谨的作风计算机专业 维护系统,技术支持 业务数据分析一、覆盖面广二、网点布局优势三、城乡贯通的网络优势一、加大业务人员的培训力度,树立品牌意识二、多样化金融业务,对客户提供人性化、个性化服务.如果让你去推销银行信用卡,

2020-12-11 11:24:49 335

原创 大数据

1.您对“大数据”一词有何了解?答: 大数据是与复杂和大型数据集相关的术语。关系数据库无法处理大数据,这就是使用特殊工具和方法对大量数据执行操作的原因。大数据使公司能够更好地了解其业务,并帮助他们从定期收集的非结构化和原始数据中获取有意义的信息。大数据还允许公司采取数据支持的更好的业务决策。2.大数据的五个V是什么?答:大数据的五个V如下:Volume -Volume表示体积大,即以高速率增长的数据量,即以PB为单位的数据量Velocity -Velocity是数据增长的速度。社交媒体在数据增长速

2020-11-05 22:30:14 322

原创 5G

1G 模电 2G 数电 短信5G有三个主要应用场景,分别是大带宽、低时延和众连接在接入方面,5G网络可以为智能交通、智慧城市、智能政务等行业应用提供海量终端接入;在通信方面,5G网络可以为机器人、无人机、无人驾驶、远程医疗等典型垂直行业应用提供超低时延、高可靠性、强安全性的通信支持,为超高清视频直播、裸眼3D、增强现实、混合现实等提供超高带宽的通信保证。4G改变生活,5G改变社会,从人人互联到万物互联,...

2020-10-31 09:42:00 631 7

原创 教育知识与能力

赞可夫- 教学与发展理论 布鲁纳-发现学习理论 教学过程最优化-巴班斯基 瓦根舍因-范例教学理论《基础教研课程改革纲要 试行》 小学阶段-综合课程 初中阶段-分科与综合 高中阶段-分科艾宾浩斯遗忘曲线 遗忘 先快后慢 先多后少 负加速课堂管理方式 团队警觉 老师让大家思考 回答最近发展区 老师考虑学生水平 也考虑老师指导水平 最近发展区教师期望效应 罗森塔尔效...

2020-02-03 21:52:51 433

转载 教资

素质教育的内涵1.素质教育是面向全体学生的教育; 2.素质教育是促进学生全面发展的教育; 3.素质教育是促进学生个性发展的教育; 4.素质教育是以培养创新精神和实践能力为重点的教育。评价观1.评价目的是促进发展; 2.评价内容多元化; 3.评价方式多样化; 4.评价主体的多元化; 5.更注重评价过程。学生观1.学生是一个完整的生命个体;2.学生个体之间存在很大的差异性;3.学生身上蕴藏...

2020-01-18 13:38:16 1567

原创 评价指标

BLEU,ROUGE,METEOR,ROUGE浅述自然语言处理机器翻译常用评价度量客观评价指标– BLEU– ROUGE– METEOR– CIDEr主观评价指标– 流畅度– 相关性– 助盲性客观评价指标实际上可以看出由于最后生成的目标内容是自然语言描述语句,因此评价VTT质量的客观标准都来源于自然语言处理领域的相关评价指标。这些指标原先都是用来度量机器翻译结果质量的,并且...

2019-07-12 13:30:35 457

原创 ADL100

trackingtransfomer众包EM算法CopyNet 是在 Seq2Seq + Attention 的基础上,引入了拷贝机制,对某些任务会有所擅长BLEU多层感知器(Multi-Layer Perceptron,MLP)也叫人工神经网络(Artificial Neural Network,ANN),除了输入输出层,它中间可以有多个隐层。最简单的MLP需要有一层隐层,即输入层、...

2019-06-29 22:38:25 188

原创 会议 大佬

微软小冰首席科学家武威解读 EMNLP 论文:聊天机器人的深度学习模型http://dy.163.com/v2/article/detail/E51C8IDP05118HA4.html多模态、个性化交互成趋势基于检索的方法的优点包括能找出很有趣、多样性很高的回复;大量借鉴了搜索引擎上的方法,可以直接采用搜索引擎上的方法(learning to rank)来进行评估。其缺点在于对话的质量完全取...

2019-06-19 16:08:06 172

原创 分类

八个分类标准(1)开发QAS的应用领域,一般域QAS的优点如下:有大量的临时用户; 通用域QAS更适合它们。通用域QAS不需要域特定字典 ; 他们使用一般字典。用户无需获取用于制定问题的特定于域的关键字的知识。在一般域QAS中可以提出大量问题库。维基百科或新闻有线文本可用作此类QAS的信息来源一般域QAS的缺点如下:答案的质量很低。答案的满意度取决于用户。领域专家需要答案中的专...

2019-06-19 09:42:23 119

原创 KB-QA

https://www.codercto.com/a/32846.html篇和KBQA多多少少有些相关的论文,有些精读有些只是略读。1.《Improving Natural Language Inference Using External Knowledge in the Science Questions Domain》在NLI(自然语言推理)任务中,提出一种结合知识库的方法。已有的引...

2019-06-18 14:00:13 744

原创 智能问答

问答系统是信息检索的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。其中问答系统是目前人工智能和自然语 言处理领域中倍受关注并具有广泛发展前景的研究方向。不同类型的问答系统对于数据处理的方法存在不同,一般问答系统的处理框架都包括问句理解、信息检索、答案生成三个功能组成部分。**问句理解:**顾客的意图只是一种抽象形式,...

2019-06-18 13:42:33 2315

原创 词向量算法

https://www.cnblogs.com/the-wolf-sky/articles/10192363.htmlhttps://blog.csdn.net/weixin_37947156/article/details/83146141基于神经网络的表示一般称为词向量、词嵌入(word embdding)或分布式表示。神经网络的词向量和其他分布式类似,都基于分布式表达方式,核心依然是上...

2019-06-05 22:31:07 6054

原创 分类器 模型

Majority是一种基本的基线方法,它将训练集中最大的情感极性分配给测试集中的每个样本。LSTM使用一个LSTM网络对上下文进行建模,并将所有隐藏状态的平均值用作最终表示来估计情绪概率。TD-LSTM采用两个LSTM网络分别为目标和右上下文建模左上下文。左右目标依赖表示被连接以预测目标的情感极性(Tang等,2016a)。AE-LSTM首先通过LSTM网络对上下文词进行建模,然后将隐藏状态...

2019-06-04 11:31:37 1232

原创 文本分类 特征选择

特征选择技术的比较:PSO,PCA和信息增益作为与基于PSO的特征选择的比较,我们利用PCA和信息增益来减少我们问题的特征空间的维度。主成分分析(PCA)[51] 是一种有用的统计技术,通过减少维数来压缩数据。它通过遗漏冗余信息找到高维数据中的模式并将其转换为较低维度。PCA通过计算协方差矩阵的特征值和特征向量来开始其处理。这些向量提供有关数据中模式的信息。特征向量对应于包含最重要模式的最高特征...

2019-06-04 11:28:20 640

原创 ASAS

Aspect的情感分析(Aspect based sentiment analysis——ABAS),ABAS的主要任务:是判断句子所在的场景在某一方面的情感极性意见目标提取方面类别定义情绪极性...

2019-06-04 11:27:59 189

原创 布谷鸟算法

寻找最小值而产生的一种算法布谷鸟在一堆鸟窝n中做选择,选出最好的鸟巢,把自己的蛋放在里面;宿主(被寄生的鸟)以一定概率pa发现有自己的鸟巢,则把布谷鸟的鸟蛋扔出去/建造新的鸟巢。布谷鸟算法(Cuckoo search, CS)是由英国学者 Xin-She Yang 和 Suash Deb 于2009年在群体智能技术的基础上提出的一种新型基于自然元启发式算法。模拟某些种属布谷鸟(Cuckoo S...

2019-06-03 15:25:35 3788

原创 粒子群算法和遗传算法的比较 退火算法

粒子群优化算法(PSO:Particle swarm optimization) 是一种进化计算技术(evolutionary computation)。源于对鸟群捕食的行为研究。粒子群优化算法的基本思想:是通过群体中个体之间的协作和信息共享来寻找最优解.通过模拟鸟群觅食过程中的迁徙和群聚行为而提出的一种基于群体智能的全局随机搜索算法  PSO的优势:在于简单容易实现并且没有许多参数的调节。目...

2019-06-03 15:18:31 7358

原创 强化学习

机器学习包含了三大分支,有监督学习(或半监督)、无监督学习和强化学习。同前两者相比,强化学习具有如下特点,  (1) 没有“supervisor”,只有“reward”信号;  (2) 反馈信号有时间延迟;  (3) 处理的是序列数据,而不是独立同分布数据;  (4) 学习体的“action”影响其后续的数据输入。rewardreward通常都被记作,表示第t个time step的返回...

2019-06-03 14:51:09 187

原创 神经网络笔记

神经网络总流程1.计算分值(分值越高就表明分类结论)2.计算损失函数(一般损失函数+正则化惩罚)3.正则化惩罚(可以看作是对损失函数的惩罚项,一般有两种方法,L1和L2,W的平方w2,为了惩罚那些虽然分值一样但是,关注的点和实际点有很大出路,例如1,0,0,0和0.25,0.25,0.25,0.25,惩罚越小就越认可,目的也是通过loss值,使得权重更均衡。其实1,0,0,0也是一种过拟合的...

2019-05-15 20:37:00 2055

原创 KNN DBSCAN k-MEANS

DBSCAN基于密度的聚类算法.(他聚类方法大都是基于对象之间的距离进行聚类,聚类结果是球状的簇)。基于密度的聚类是寻找被低密度区域分离的高密度区域定义:基于密度的带有噪声的空间聚类,可用于异常值监测,通俗来说就是基于密度的聚类算法!簇的定义:簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并且可以在噪声的空间数据库中发现任意形状的聚类原理:该算法利用基于密度的聚类的思...

2019-05-15 09:59:04 1364

原创 SVM

https://blog.csdn.net/v_july_v/article/details/7624837https://blog.csdn.net/liugan528/article/details/79448379https://blog.csdn.net/sinat_35512245/article/details/549842511、LR是参数模型,SVM是非参数模型。2、从目标...

2019-05-15 09:45:28 103

原创 主成分分析 PCA 线性判别分类LDA

降维就是一种对高维度特征数据预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就...

2019-05-15 09:29:27 2847

转载 支持向量机

https://blog.csdn.net/qq_35992440/article/details/80987664http://www.360doc.com/content/18/0805/10/11935121_775817898.shtml

2019-05-14 13:40:03 57

原创 情感分析 综述

情感分析或观点挖掘是对人们对产品、服务、组织、个人、问题、事件、话题及其属性的观点、情感、情绪、评价和态度的计算研究。该领域的开始和快速发展与社交媒体的发展相一致,如评论、论坛、博客、微博、推特和社交网络,因为这是人类历史上第一次拥有如此海量的以数字形式记录的观点数据。早在 2000 年,情感分析就成为 NLP 中最活跃的研究领域之一。它在数据挖掘、Web 挖掘、文本挖掘和信息检索方面得到了广泛的...

2019-05-13 16:14:55 7196 1

转载 决策树

https://blog.csdn.net/jiaoyangwm/article/details/79525237

2019-05-11 11:16:36 801

原创 逻辑回归

似然函数 最大值X i ji 第i个数据j 第j维特征

2019-05-08 16:02:28 97

原创 梯度下降

小 学习率 0.01大 迭代次数 32 64 128

2019-05-08 13:07:35 72

原创 线性回归

残差平方和 预测值 真实值 差异

2019-05-08 11:23:36 94

原创 NLP中文分词工具比较

NLP中文分词工具比较四款python中中文分词的尝试。尝试的有:jieba、SnowNLP(MIT)、pynlpir(大数据搜索挖掘实验室(北京市海量语言信息处理与云计算应用工程技术研究中心))、thulac(清华大学自然语言处理与社会人文计算实验室)https://blog.csdn.net/gdh756462786/article/details/79102642...

2019-05-06 16:04:16 637

原创 情感分析

**基于词典的情感分析大致步骤如下**分解文章段落分解段落中的句子分解句子中的词汇搜索情感词并标注和计数搜索情感词前的程度词,根据程度大小,赋予不同权值搜索情感词前的否定词,赋予反转权值(-1)计算句子的情感得分计算段落的情感得分计算文章的情感得分基于机器学习的情感分析文本结构化文本向量化词条权值特征提取分类算法选择训练模型和评价预训练方法1)wor...

2019-05-05 17:03:01 387

原创 情感分析资源大全(语料、词典、词嵌入、代码)

https://blog.csdn.net/qq280929090/article/details/708380251 语料库1.1 谭松波-酒店评论语料-UTF-8,10000条  现在网上大部分谭松波老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。 本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数...

2019-05-05 15:52:55 4947 1

原创 2018 NLP

自然语言处理概述(前沿、数据集、下游任务)https://blog.csdn.net/xuan100e/article/details/89544956ELMo(Embeddings from Language Models)是一种动态的,语境化的词向量表示方法,可以根据上下文语境来生成相应词的向量表示ELMo通过深度双向语言模型(biLM)进行训练,主要解决了两个问题:(1) 学习词汇用...

2019-05-03 09:28:11 119

原创 软考

**程序计数器(PC)**是用于存放下一条指令所在单元的地址的地方。**累加器(AC)**全称累加寄存器,是一个通用寄存器。其功能是,当运算器的算术逻辑单元(ALU)。执行算术或逻辑运算时,为 ALU 提供一个工作区。累加寄存器暂时存放 ALU 运算的结果信息。**指令寄存器(IR)**用于存放当前从主存储器读出的正在执行的一条指令。**地址寄存器(AR)**用来保存当前 CPU 所访问的内...

2019-04-23 13:50:51 932

原创 python 自然语言处理实战

Jibea词性标注北大词性标注集宾州词性标注集关键词提取算法 TF/IDFTextBank算法LSA(SVD奇异值分解)LDA(贝叶斯)

2019-04-15 18:46:28 2194

原创 基于深度学习的自然语言处理

CBOW 表示可以通过求单词表示向量和或者通过将一个单词词袋向量乘以一个每一行对应于一个稠密单词表示的矩阵(这样的矩阵也叫作嵌入矩阵( embedd i ngmatricy ))来得到。网络中每行神经元的值可以看作是一个向量全连接层可以看作是从四维到六维的线性变换。全连接层实现了一个向量与矩阵的乘法, h=xW由线性变换产生的向量称为层。最外层的线性变换产生输出层,其他线性变换产生隐...

2019-04-09 20:00:35 1758

原创 数据处理 sklearn

contour和contourf都是画三维等高线图的,不同点在于contourf会对等高线间的区域进行填充import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapx=np.array([1,2])y=np.array([1,2])z=np.array([[...

2019-04-08 21:55:54 154

原创 attention RNN LSTM Gru gate dropout 隐马尔可夫链

attention注意力机制即 Attention mechanism在序列学习任务上具有巨大的提升作用,在编解码器框架内,通过在编码段加入Attention模型,对源数据序列进行数据加权变换,或者在解码端引入Attention 模型,对目标数据进行加权变化,可以有效提高序列对序列的自然方式下的系统表现。原文:https://blog.csdn.net/guohao_zhang/article...

2019-04-07 22:14:37 1299

原创 机器学习常见

泛化能力机器学习模型在训练数据集上表现出的误差叫做训练误差在任意一个测试数据样本上表现出的误差的期望值叫做泛化误差机器学习既需要降低训练误差,又需要降低泛化误差。泛化是机器学习本身的核心。简单说,泛化就是在训练数据集上训练好的模型,在测试数据集上表现如何。泛化误差就是所学习到的模型的风险函数或期望损失正则化是我们用来防止过拟合的技术。由于我们没有任何关于测试扰动的先验信息,所以通常我们...

2019-04-07 16:38:05 178

原创 机器学习实战总结

K-近邻算法优点:精度高 对异常值不敏感 无数据输入假定缺点:复杂度高适用范围:数值型 标称型收集数据准备数据 距离计算所需要的数据。最好结构化分析数据训练算法 不适合测试算法 计算错误率使用算法2. 决策树优点:计算复杂度不高 输出结果易于理解 可以处理不相关特征数据缺点:过度匹配收集数据准备数据 只适用于标称型,数值型离散化分析数据训练算法 构造树的数...

2019-04-07 14:01:13 164

原创 MySql

【数据库】MySQL的左连接、右连接和全连接的实现表student:±—±----------±-----+| id | name | age |±—±----------±-----+| 1 | Jim | 18 || 2 | Lucy | 16 || 3 | Lily | 16 || 4 | Lilei | 17 || 5 | Hanmeimei | 16 |±—±----...

2019-04-05 15:57:17 92

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除