自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

angus_monroe的博客

菜鸡养成中

  • 博客(3)
  • 收藏
  • 关注

原创 Python中gensim库word2vec的使用

Python中gensim库word2vec的使用:pip install gensim安装好库后,即可导入使用:1、训练模型定义from gensim.models import Word2Vec  model = Word2Vec(sentences, sg=1, size=100,  window=5,  min_count=5,  negative=3, sample=0....

2017-08-09 16:23:52 19763 4

原创 “智能问诊”项目——数据获取(3)

用之前获取到的数据对word2vec进行训练时发现得到的模型并不理想,所以为了使模型更加精确,我决定增加数据量继续进行训练要从哪里获取大量的数据就是一个很头疼的事了,我一直没有很好的解决方案,直到昨天另外一个项目组开会时一个学长的方案给了我很大启发这里数据的来源就是百度百科,经过观察很容易发现,百度百科有一个特点,其不同词条前半部分URL是相同的,都是https://baike.baidu

2017-08-08 16:44:12 1850

原创 “智能问诊”项目——机器学习(1)

经过对各种机器学习算法的初步了解,我最终选定了word2vec来实现药品推荐的功能word2vec是word embedding(词向量)的一种浅层神经网络训练方法。word embedding的这一系列的训练方法,都有一个有趣的现象,那就是训练的主要目标居然是获得side effect的词向量,而不是神经网络的预测模型。这是一种Transfer Learning的思想。这种思想非常值得学

2017-08-06 19:13:25 2242 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除