- 博客(3)
- 收藏
- 关注
原创 Python中gensim库word2vec的使用
Python中gensim库word2vec的使用:pip install gensim安装好库后,即可导入使用:1、训练模型定义from gensim.models import Word2Vec model = Word2Vec(sentences, sg=1, size=100, window=5, min_count=5, negative=3, sample=0....
2017-08-09 16:23:52 19763 4
原创 “智能问诊”项目——数据获取(3)
用之前获取到的数据对word2vec进行训练时发现得到的模型并不理想,所以为了使模型更加精确,我决定增加数据量继续进行训练要从哪里获取大量的数据就是一个很头疼的事了,我一直没有很好的解决方案,直到昨天另外一个项目组开会时一个学长的方案给了我很大启发这里数据的来源就是百度百科,经过观察很容易发现,百度百科有一个特点,其不同词条前半部分URL是相同的,都是https://baike.baidu
2017-08-08 16:44:12 1850
原创 “智能问诊”项目——机器学习(1)
经过对各种机器学习算法的初步了解,我最终选定了word2vec来实现药品推荐的功能word2vec是word embedding(词向量)的一种浅层神经网络训练方法。word embedding的这一系列的训练方法,都有一个有趣的现象,那就是训练的主要目标居然是获得side effect的词向量,而不是神经网络的预测模型。这是一种Transfer Learning的思想。这种思想非常值得学
2017-08-06 19:13:25 2242 5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人