自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 【机器学习入门】线性回归和逻辑回归的理解和推导

线性回归线性回归用于回归问题,在回归模型中,线性回归绝对是最简单的,但是并不妨碍他成为帮助研究回归问题上的强力工具。对于绝大部分的数据回归问题,线性回归都是我们的首选。他主要有以下优点:模型简单、易于建模解释性强、易于调试一般形式给定由d个属性描述的示例x=(x1;x2;...;xd)x=(x_1;x_2;...;x_d)x=(x1​;x2​;...;xd​),其中xix_ixi​是xxx在第iii个属性上的取值,让我们来预测xxx所对应的yyy值。线性回归所做的就是假定特征x与目标变量y之间

2020-07-05 16:16:15 448 1

原创 【论文阅读报告】Visualizing and Understanding Convolutional Networks

背景众所周知,卷积神经网络在图像处理方面表现突出,但是在很多情况下,我们在调参数时只是依靠运气,并不知道自己对参数和网络结构的调整会影响神经网络的哪一部分。因此这篇文献的目的就是让我们通过一种可视化的方法来了解卷积神经网络如何工作,以及每一层的特征。主要内容介绍一种可视化技术,用于解释模型任何层上的特征通过遮挡输入图像的某些部分来对分类器输出进行敏感性分析,以了解图片的那些部分为分类器提供了信息1.可视化技术(反卷积)*首先,作者使用了传统的CNN模型,在此基础上对进行研究。作者利用反卷积

2020-07-01 13:18:28 480

原创 【论文阅读报告】Distributed Representations of Words and Phrases and their Compositionalit

主要内容本篇论文的主要内容为对skip-gram模型的优化扩展,主要内容包括以下三点对高频词重采样negative sampling(负采样)从基于单词的模型扩展到基于短语的模型高频词重采样在语料库非常大的时候,一些高频词很容易出现上百万甚至上亿次,然而这些高频词能提供的信息一般都比那些低频次要来的少。所以为了平衡高频词和低频词的样本数量,本文提出了二次采样的方法,在二次采样中,每个词语都有一定几率会被丢弃,概率计算公式如下:P(wi)=1−tf(wi)P(w_i) = 1 - \sqr

2020-06-18 18:20:20 1028

原创 skip-gram模型理解

主要内容刚读完《Distributed Representations of Words and Phrases and their Compositionalit》打算论文报告,因为和skipgram关系比较深,所以再顺便介绍一下skip-gram模型。词嵌入(word embedding)词嵌入技术顾名思义,就是把一堆词语映射(嵌入)到同一个空间中,不同的词处于不同位置,这些位置特征(向量)即词向量。通俗的说,词嵌入就是把不同的词转化成不同的向量。one-hot向量在word2vec被提出之前

2020-06-18 14:46:45 6540 1

原创 【论文阅读报告】 Real-time Personalization using Embeddings for Search Ranking at Airbnb

【论文阅读】 Real-time Personalization using Embeddings for Search Ranking at Airbnb主要内容Airbnb作为全球最大的住宿网站之一,其团队希望构建一个能够实时为用户提供个性化的房源排名的系统。Airbnb利用word2vec模型针对用户的长期兴趣和短期兴趣分别对房源和用户做了嵌入式编码,以此编码为依据来为用户提供他们想要的房源列表。用户的短期兴趣:对应listing embedding,与用户此次旅游决定去的地方有关用户的长期

2020-06-10 22:50:02 443

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除