若向人间借回眸-CSDN博客

原创 kettle配置及应用尝试

kettle下载及配置kettle安装kettle安装包：百度网盘提取码：2333环境配置要运行软件的可视化界面，需要下载jdk并配置环境变量（jdk下载请自行百度）在系统环境变量的CLASSPATH中加入 .;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar在系统环境变量中新建JAVAHOME，配置如下：在系统环境变量的path中加入%JAVA_HOME%\bin%JAVA_HOME%\jre\bin环境配置好后即可解压kett

2020-09-23 19:44:45 368

原创 GNN,GCN学习整理

GNNGNN定义GNN是Graph Neural Network的简称，是用于学习包含大量连接的图的联结主义模型。当信息在图的节点之间传播时GNN会捕捉到图的独立性。与标准神经网络不同的是，GNN会保持一种状态，这个状态可以代表来源于人为指定的深度上的信息。图神经网络处理的数据就是图，而图是一种非欧几里得数据。GNN的目标是学习到每个节点的邻居的状态嵌入，这个状态嵌入是向量且可以用来产生输出，例如节点的标记。如下图，最终的目的就是学习到红框的H，由于H是定点，因此可以不断迭代直到H的值不再改变即停止。

2020-08-21 00:18:37 8011 1

原创 2020腾讯广告算法大赛赛题复现

赛题分析本届算法大赛的题目是“广告受众基础属性预估”。赛题背景众所周知，像用户年龄和性别这样的人口统计学特征是各类推荐系统的重要输入特征，其中自然也包括了广告平台。这背后的假设是，用户对广告的偏好会随着其年龄和性别的不同而有所区别。许多行业的实践者已经多次验证了这一假设。然而，大多数验证所采用的方式都是以人口统计学属性作为输入来产生推荐结果，然后离线或者在线地对比用与不用这些输入的情况下的推荐性能。本届大赛的题目尝试从另一个方向来验证这个假设，即以用户在广告系统中的交互行为作为输入来预测用户的人口统计

2020-08-13 23:56:12 527

原创集成学习整理

基础概念在机器学习的有监督学习算法中，我们的目标是学习出一个稳定的且在各个方面表现都较好的模型，但实际情况往往不这么理想，有时我们只能得到多个有偏好的模型（弱监督模型，在某些方面表现的比较好）。集成学习就是组合这里的多个弱监督模型以期得到一个更好更全面的强监督模型，集成学习潜在的思想是即便某一个弱分类器得到了错误的预测，其他的弱分类器也可以将错误纠正回来。集成方法是将几种机器学习技术组合成一个预测模型的元算法，以达到减小方差（bagging）、偏差（boosting）或改进预测（stacking）的效果

2020-08-06 23:39:20 255

原创端对端学习与多任务学习整理

端对端学习基础概念相对于深度学习，传统机器学习的流程往往由多个独立的模块组成，比如在一个典型的自然语言处理（Natural Language Processing）问题中，包括分词、词性标注、句法分析、语义分析等多个独立步骤，每个步骤是一个独立的任务，其结果的好坏会影响到下一步骤，从而影响整个训练的结果，这是非端到端的。而深度学习模型在训练过程中，从输入端（输入数据）到输出端会得到一个预测结果，与真实结果相比较会得到一个误差，这个误差会在模型中的每一层传递（反向传播），每一层的表示都会根据这个误差来做

2020-07-31 01:34:45 484 1

原创 attention机制学习

attention机制概述attention机制是模仿人类注意力而提出的一种解决问题的办法，简单地说就是从大量信息中快速筛选出高价值信息。主要用于解决LSTM/RNN模型输入序列较长的时候很难获得最终合理的向量表示问题，做法是保留LSTM的中间结果，用新的模型对其进行学习，并将其与输出进行关联，从而达到信息筛选的目的。encoder+decoder背景encoder+decoder，中文名字是编码器和解码器，应用于seq2seq问题，其实就是固定长度的输入转化为固定长度输出。其中encoder和dec

2020-07-24 01:03:28 714

原创 TextCNN模型学习及实验

TextCNN模型原理在2014年，Yoon Kim针对CNN的输入层做了一些变形，提出了文本分类模型textCNN。与传统图像的CNN网络相比, textCNN 在网络结构上没有任何变化, 从下图可以看出textCNN 其实只有一层卷积,一层max-pooling, 最后将输出外接softmax 来n分类。TextCNN详细过程：**· Embedding：**第一层是图中最左边的7乘5的句子矩阵，每行是词向量，维度=5，这个可以类比为图像中的原始像素点。**·Convolution：**然后经

2020-07-16 18:18:08 1922

原创经典神经网络实验篇

经典神经网络实验整理lenet5模型实现手写体数字识别本次实验通过lenet5模型和MNIST数据集实现手写体数字识别训练。MNIST数据集是一个手写数字的数据库，对于卷积神经网络是一个最为简单的图片数据集。MNIST的下载地址为 http://yann.lecun.com/exdb/mnist/该数据集包含四个文件，分别为测试图像，测试标签，训练图像和训练标签。MNIST数据集图片的像素皆为28*28，单通道。标签为1-10，对应的是0-9十个数字。对于MNIST数据集，TensorFlo

2020-07-10 01:34:32 1324

原创经典神经网络模型整理

经典神经网络模型整理神经网络基础知识BP神经网络的概念单个神经元的结构CNN模型汇总LeNet5 模型AlexNet 模型VGG模型Inception Net（GoogleNet）模型ResNet （残差网络）RNN模型（循环神经网络）为什么需要RNNRNN结构LSTM（长短期记忆网络）模型GRU模型计算重置门r~t~和候选状态计算更新门z~t~和当前状态h~t~神经网络基础知识本周主要对于神经网络的相关知识进行了学习，本文先整理神经网络学习中所需的一些基础知识，而后整理了四个经典的神经网络模型以作记录

2020-07-03 01:37:32 7560

mubaba_的博客