自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

sunny的博客

本博客主要记录日常学习,交流编程学习

  • 博客(4)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 文本向量化-计算文本相似的的方法-基于python语言的实现

本节主要讨论三种方法实现中文文本的向量化,编程环境python3.6. TF 词频的方法 TFIDF 词频-逆文档频率 Word2Vec 第一种TF方式,即是基于词频的方式,举一个最简单的例子: 1:今天天气不错! 2:今天天气很好。 针对英文,我们可以直接跑程序,计算文本向量,英文单词都是以空格分割好的,但是对于中文,我们需要进行如下的几个处理步骤,分词、去停用词(使用在word2vec里,

2017-11-23 17:29:08 5889

原创 图片处理1

原帖:http://www.bubuko.com/infodetail-514985.html最近接触到了一个非常有意思的东西,训练图片,训练结束后,返回对这个图片的描述。 斯坦福大学建立了一个可以对图像内容产生自然语言描述的模型NaturalTalk,它是一个开源的Python工具,它可以从图像生成文本描述。它实现了Google (Vinyals等,卷积神经网络CNN + 长短期记忆LSTM) 和

2017-11-22 15:32:10 355

原创 TEXT

loss N S LC loss N ext S LC 农作物受灾面积 5.6 千 公顷,直接经济损失 4400 余 万 元 loss N LC N LC loss N LC N LC 房屋倒塌 30 户 99 间, 重损 2769 户 9626 间

2017-11-08 22:09:46 152

原创 test

ext N M obj trg N ext M oth trg 至少 27 名 师生 死亡,100 多 人 不同程度 受伤 trg N ext M obj 死亡 50 多 名 工人 ext = 程度副词1 N = 数词 M = 人类数量词

2017-11-08 16:36:50 134

数据分析-运动员数据

本数据主要是数据分析课程涉及 的数据,在本人博客中也会随时更新相应代码,一起来学习数据分析把

2019-04-18

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除