自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 通过word2vec学习词向量

词向量 通过word2vec学习词向量 word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测,对于每一条输入文本,我们选取一个上下文窗口和一个中心词,并基于这个中心词去预测窗口里其他词出现的概率因此,word2vec模型可以方便的从新增语料中学习到新增词的向量表达,是一种高效的在线学习方法 word2vec的主要思路:通过单词和上下文彼此预测,对应的两个算法为: 1.Skip-grams(SG):预测上下文 2.Continuous Bag of Words(CBOW):预测目标单词 两种更

2021-06-16 16:43:20 184

原创 RNN理解

RNN(循环神经网络) 神经网络:神经网络可以当做是能够拟合任意函数的黑盒子,只要训练数据足够,给定特定的x,就能得到特定的y 但他们都只能单独的取处理一个个的输入,前一个输入和后一个输入是完全没有关系的 但某些任务需要更好的处理序列的信息,即前面的输入和后面的输出是有关系的 但是很明显,一个句子中,前一个单词其实对于当前单词的词性预测是有很大影响的 RNN结构 一个简单的循环神经网络,由输入层,一个隐藏层和一个输出层组成 如果将上面有w的那个带箭头的圈去掉,它就变成了最普通的全连接神经网络 x是一个向量

2021-06-16 16:34:54 125

原创 python文本多分类

文本多分类 数据读取与数据分析 2.1.2 数据读取 可以直接用Pandas完成数据读取的操作 import pandas as pd train_df = read_csv(‘D:\text/train_set.csv’,sep = ‘\t’,nrows = 100) 参数: 1.读取的文件路径,也可以是URL,也可以是实现read方法的任意对象 2.sep 读取csv文件时指定的分隔符,默认为逗号,注意csv文件的分隔符和我们读取csv文件时指定的分隔符一定要一致 3.nrows 设置一次性读入的文件

2021-06-16 16:28:23 459

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除