自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

素质云笔记

营销数据科学:因果推断,CDP,用户画像,短视频挖掘等

  • 博客(4)
  • 资源 (5)
  • 收藏
  • 关注

原创 练习题 - 基于快速文本标题匹配的知识问答实现(二,实现篇)

承接练习题 - 基于快速文本标题匹配的知识问答实现(一,基础篇),前篇主要把qdr这个项目解剖了一下,现在开始应用做一下问答。 可以看到qdr这个项目的特点是:可以快速比对两个文本之间的相似性,而且计算tfidf、bm25、lm三款模型的速度很快。 那么本轮知识问答的设计源于此:先储备一批问答语料,一问一答比较合适;把问题进行分词,变为文本序列;载入qdr模型之中,进行训练; 先t...

2018-08-30 22:30:19 1303 1

原创 练习题 - 基于快速文本标题匹配的知识问答实现(一,基础篇)

该练习题来的很蹊跷,笔者在看entity embeddings的东西,于是看到了16年的这篇文章:Learning Query and Document Relevance from a Web-scale Click Graph,想试试效果,就搜到了qdr这个项目,然后试了试,虽然entity embeddings做的不好,但是好像可以依据里面的文本匹配搞搞问答,于是花了一点时间,因为是c...

2018-08-30 21:31:49 1388 2

原创 流水账︱Elmo词向量中文训练过程杂记

1 elmo是什么?参考:《文本嵌入的经典模型与最新进展》 人们已经提出了大量可能的词嵌入方法。最常用的模型是 word2vec 和 GloVe,它们都是基于分布假设的无监督学习方法(在相同上下文中的单词往往具有相似的含义)。虽然有些人通过结合语义或句法知识的有监督来增强这些无监督的方法,但纯粹的无监督方法在 2017-2018 中发展非常有趣,最著名的是 FastText(word2v...

2018-08-21 22:53:21 24731 13

原创 pyecharts︱交互式pyecharts的相关使用教程

pyecharts 是一个用于生成 Echarts 图表的类库。Echarts 是百度开源的一个数据可视化 JS 库。用 Echarts 生成的图可视化效果非常棒,为了与 Python 进行对接,方便在 Python 中直接使用数据生成图,我写了这个项目。以下是最新版echart的靓图。当然,pyecharts貌似没有这么齐全。 官方文档:http://pyecharts.herokuap............

2018-08-07 22:38:50 15043

Rstudio Server + Docker + tensorflowR的dockerfile文件

Rstudio Server + Docker + tensorflowR - 云端使用R语言与GPU深度学习

2018-09-28

数美科技李田:机器学习与在数美业务上的落地

数美科技李田:机器学习与在数美业务上的落地

2018-09-11

Prophet的案例数据

R的Prophet包的数据集

2017-02-26

VMware-player-12.0.0-part1

VMware-player-12.0.0-part1,一共两个部分。

2016-11-19

word2vec自编译函数(By Jian Li,2014-09-21)

R语言实现深度学习word2vec,word2vec包含两个模型CBOW以及Skp-gram模型,R语言实现的过程中需要配置一些内容,详情见包中附件readme。

2016-05-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除