自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 scrapy

最近看了一点scrapy,看得比较少,也比较乱。因为主要就是运行现成的代码,所以想说一下怎么在终端运行写好的scrapy代码。1):首先我们建立一个目录,进入自己想要建立的位置,在终端输入scrapy startproject 目录名字,即可建立一个新的目录进入之后我们可以看见里面有一个spiders文件夹,所有的爬虫项目都可以写在这里面。当我们写完之后,进入到根目录中,按住shift键然后右...

2019-10-29 16:31:57 163

原创 word2ver在tensorflow中实现

下面是word2vec在tensorflow中实现的代码from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionimport collectionsimport reimport mathimport randomimpor...

2019-10-26 22:21:05 254

原创 word2vec

word2vec是什么:1)word2vec是一种词的表示,类似于one-hot,只不过他将词以固定维数的向量表示出来。每个词都表示成一个n维的向量。2)Word2vec在对词进行编码时充分利用上下文的信息,每个词不在是只有一个位置是1的稀疏向量。而是一个稠密的固定维度向量。利用上下文信息对词语有一个更深的表达。Word2vec的实现方式:1)利用上下文来预测中心词cbow(连续词袋模型)...

2019-10-25 20:31:09 391

原创 one-hot编码

one-hot编码:目的:为了方便计算机进行存储和处理表示形式:用0和1来表示。由状态位来表示特征,假如我们有四个特征。分别是1,2,3,4.那么我们就需要四个状态位来表示这几个特征1-[1 0 0 0]2-[0 1 0 0]3-[0 0 1 0]4-[ 0 0 0 1]这几个行向量分别表示1,2,3,4one-hot编码就是保证每个样本中的单个特征只有1位处于状态1,其他的都是0...

2019-10-24 11:27:19 271

原创 自然语言处理

NLP学习记录 目前研一新生在读,研究方向是自然语言处理,主要处理的是中医文本。刚开始感觉很迷茫不知道该怎么办,想要用博客来记录下我的学习过程,也欢迎更多的同学和大佬们能够给我提出批评和指证。...

2019-10-24 09:28:01 940

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除