自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (14)
  • 收藏
  • 关注

转载 【python gensim使用】word2vec词向量处理中文语料

版权声明:本文为博主 http://blog.csdn.net/churximi 原创文章,未经允许不得转载,谢谢。 https://blog.csdn.net/churximi/article/details/51472300 </div> <div id="content_views" class...

2019-02-21 13:40:03 1539 1

转载 CS224N研究热点2_Linear Algebraic Structure of Word Senses, with Applications to Polysemy(对于一词多义的向量表示研究)

Paper:Linear Algebraic Structure of Word Senses, with Applications to Polysemy源代码词向量编码的相似性相似的单词的词向量编码在欧几里得空间中的分布会彼此相邻:如何表示多义词?比如,tie在游戏比赛的平局;在衣服中的领带;或者表示一种扭曲的动作。实际得到的tie的词向量是tie-1、tie-2、tie-3...

2019-02-21 13:01:06 565

原创 一个简单但很难超越的Sentence Embedding基线方法论-笔记

源码地址https://github.com/PrincetonML/SIF1.目的创建句向量2.方法论文地址:第一步,对句子中的每个词向量,乘以一个独特的权值。这个权值是一个常数αα除以αα与该词语频率的和,也就是说高频词的权值会相对下降。求和后得到暂时的句向量。然后计算语料库所有句向量构成的矩阵的第一个主成分uu,让每个句向量减去它在uu上的投影(类似PCA)。...

2019-02-21 12:41:33 886

转载 理解GloVe模型(+总结)

系列目录(系列更新中) 第二讲 cs224n系列之word2vec & 词向量 word2vec进阶之skim-gram和CBOW模型(Hierarchical Softmax、Negative Sampling) 第三讲 cs224n系列之skip-pram优化 & Global Vector by Manning & 词向量评价 理解Glo...

2019-02-18 10:29:58 2078

翻译 Skip-Gram直观理解( Word2Vec Tutorial - The Skip-Gram Model, Word2Vec (Part 1): NLP With Deep Learning翻译)

什么是Word2Vec和Embeddings?  Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型,它被大量地用在自然语言处理(NLP)中。那么它是如何帮助我们做自然语言处理呢?Word2Vec其实就是通过学习文本来用词向量的方式表征词的语义信息,即通过一个嵌入空间使得语义上相似的单词在该空间内距离很近。Embedding其实就是一个映射,将单词从原先所属的空间映射到新的...

2019-02-16 10:42:50 948

原创 逻辑回归算法步骤

 结合西瓜书理解

2019-02-15 11:11:08 2842

原创 机器学习中L1正则化和L2正则化有什么区别?

1.正则化的作用  机器学习中,如果参数过多,模型过于复杂,容易产生过拟合状态,故正则化的提出是为了一定程度上避免过拟合。比如,常见的L1和L2正则化。2.正则化公式L1:L1正则化是在原来的损失函数基础上加上权重参数的绝对值。L2:L2正则化是在原来的损失函数基础上加上权重参数的平方和。 它们的直观解释参照红色石头博客https://blog.csdn.n...

2019-02-15 10:08:49 3478

转载 西瓜书-逻辑回归算法的使用

1.任务名称:实验-sklearn-user-guide 1.1.112.使用包:sklearn(里面提供了许多机器学习算法的详细教程和案例,需要多多掌握)3.资料地址:http://sklearn.apachecn.org/#/docs/79逻辑回归逻辑回归(Logistic regression 或logit regression),即逻辑模型(英语:Logit model,也...

2019-02-15 09:15:01 1789

原创 西瓜书-3.18,3.19理解过程-对数几率回归

  3.22到3.23,3.24的推导过程 

2019-02-14 14:15:10 588

原创 西瓜书-3.14,3.15理解过程-广义线性模型

假设样本的输出标记符合指数趋势的变化,以对数线性回归为例:  (3.14)形式上描述的是对于整体的线性规律对于y而言,描述的是:y=3.15也较好理解注:广义线性模型的参数估计方法有      1.加权最小二乘法      2.极大似然估计  ...

2019-02-14 13:53:49 287

原创 西瓜书-3.9,3.10理解过程-线性模型

许多人对3.9公式不理解,其实,min右侧只是用矩阵的形式表示了均方差的概念(大家可以结合矩阵的乘法运算举个例子试试),argmin表示右侧式子最小时w取得的值,我们的目标就是求出这个向量w 需要注意的是:实际问题中,我们的样例数可能很少,而属性维度却很大,即造成了求出多个权重向量维度的情况,都能使得均方误差最小化,此时,如何选择最终结果呢?决定因素:学习算法的归纳偏好 做法:...

2019-02-14 11:26:25 1228 2

原创 西瓜书-3.5,3.6,3.7,3.8推导过程

1.什么是线性模型  碰到不熟悉的概念,我们首先从名字本身着手。  线性:顾名思义,表示模型是一个线性组合, 模型: 可以理解成表示实际问题的一个函数(通过输入,可以得到输出-即结果)于是,线性模型有了以下定义: 2.线性回归已知:,目标:试图通过现有数据构建一个线性模型,使其尽可能准确的预测输出标记。解法:最小二乘法(实质就是试图找到一条直线,使得所有样本...

2019-02-14 10:54:57 1503 1

小五整理-机器学习第一讲-课件和笔记(包含统计学习方法pdf)

(http://www.sunxiaowu.top)美学编程网、人工智能技术体系-机器学习基础第一讲、小五资料整合

2018-06-08

初学者好玩儿的小程序

初学者好玩儿的小程序 初学者好玩儿的小程序初学者好玩儿的小程序 初学者好玩儿的小程序

2017-12-04

感知机简单实现c++

感知机简单实现,整个项目直接打包,没有添加第三方库,方便大家学习调试 c++

2017-12-03

wine_data_set

机器学习 wine data set

2017-11-15

wine-dataset

机器学习中的wine-dataset数据集 机器学习中的wine-dataset数据集

2017-11-15

深度探索c++对象模型

深度探索c++对象模型c++进阶基本书籍,读完c++ primer,并做了一些小项目之后,就可以开始看这本书,从深层次和原理上深入探索c++的很多内存布局和机制等

2017-09-03

gperf-3.0.1-windows

完美哈希生成器

2017-08-05

unix环境高级编程源码(apue)

unix环境高级编程源码

2017-07-09

基于boost的tcp通信程序

基于boost库的最基本tcp通信程序,包括客户端和服务器端

2015-10-30

数值分析课件

数值分析的好课件 有助于同学们学习此门课程

2013-04-02

c语言编写多项式的加减乘

运用c语言 通过建立动态链表来实现多项式的加法 加法 和乘法

2012-11-23

运算符重载函数的运用

运用运算符重载函数对复数实施加减乘除的操作(c++编写)

2012-10-31

用c++编写的一元二次方程的解

用c++写的解一元二次方程的代码 输入“yes"可继续输入a,b,c的值 解除对应的解 输入其他则结束此程序

2012-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除