![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
人马座α星
这个作者很懒,什么都没留下…
展开
-
paddlehub自定义数据集
参考地址在paddlehub中的例子需要构建数据集。demo中的代码如下dataset = hub.dataset.ChnSentiCorp()当替换为自定义数据集时,首先需要将自己的数据集转换为如下形式。train.tsvdev.tsvtest.tsv然后,定义自己的数据集函数进行转换dataset = DemoDataset(dataset_dir=model_path)...原创 2019-10-21 15:39:18 · 1893 阅读 · 4 评论 -
Word2Vec总结
Word2Vec 理解总结统计语言模型提到Worde2vec,就不得不从统计语言模型开始讲起。什么是统计语言模型,《数学之美》中给出了很好的答案。看一个句子是否通顺,读者是通过句子语法来了解。而计算机则是通过概率来得到。即本句子各词出现这样排列的可能性的大小决定了词句子是否合理。什么是统计语言模型,《数学之美》中给出了很好的答案。看一个句子是否通顺,读者是通过句子语法来了解。而计算机则是通过概...原创 2018-12-26 10:00:53 · 210 阅读 · 0 评论 -
基于Gensim的work2vec程序实现
work2vec官方API地址models.word2vec – Word2vec embeddingsmodels.word2vec这个模块实现了word2vec算法。其中包括基于Hierarchical和Negative的CBOW和Skip-gram网络。class gensim.models.word2vec.Word2Vec(sentences=None, size=100, al...原创 2018-09-20 11:28:57 · 392 阅读 · 0 评论