![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
angus_monroe
百无一用的愤青
展开
-
机器学习笔记(1)——决策树
机器学习中分类和预测算法的评估:准确率速度强壮性可规模型可解释性 决策树决策树是一个类似于流程图的结构节点表示判断,将连续变量离散化,规定阈值归类信息熵:变量的的不确定性越大,熵也就越大 计算公式:P(x)为单个事件的概率决策树归纳算法(ID3)选择属性判断结点 信息获取量(Information Gain):Gain(A原创 2017-07-30 17:18:43 · 443 阅读 · 0 评论 -
Google-ML-Recipes-Chs-sub-and-code学习笔记
Google-ML-Recipes-Chs-sub-and-code学习笔记Google-ML-Recipes-Chs-sub-and-code代码及笔记在 https://github.com/AngusMonroe/GoogleMachineLearning 持续更新原创 2019-02-10 13:56:53 · 257 阅读 · 0 评论 -
Dialogue System Survey
Dialogue System SurveyTask-orientedNon-task-orientedDiscussionTask-oriented dialogue system目的:帮助用户完成某些特定任务,比如查找产品、客服等特点:通常需要在外部知识库上进行查询Pipeline Methods基于管道的面向任务的对话系统的四个组成部分:自然语言理解(NLU):...原创 2018-11-05 09:28:32 · 1424 阅读 · 0 评论 -
Hierarchical Recurrent Encoder-Decoder
Hierarchical Recurrent Encoder-DecoderBuilding End-to-End Dialogue Systems Using Generative Hierarchical Neural Network ModelsIntroductionseq2seq的典型方法,用前N-1句话生成第N句话。假如说现在A, B对话内容是:a1,b1,a2,b2a1,b1,...原创 2018-10-21 11:01:42 · 1411 阅读 · 0 评论 -
主题感知的响应生成——TA-Seq2Seq model
主题感知的响应生成——TA-Seq2Seq《Topic Aware Neural Response Generation》概述本文介绍了一种将topic model与seq2seq的方法,主题来自于预训练LDA模型,为了增加主题词出现在回答中的可能性,该模型通过添加额外的概率项来偏向整体分布来修改主题词的生成概率。该模型利用主题来模拟人类的先验知识,指导他们在对话中形成信息性和有趣的反应,...原创 2018-10-20 00:37:19 · 1044 阅读 · 0 评论 -
numpy学习笔记
numpy学习笔记Why numpy?numpy是科学运算中非常重要的一个模块,在数据分析、机器学习、深度学习等方面都有应用其优点包括:运算速度快:numpy都是采用C语言编写消耗资源少:采用的是矩阵运算,会比 python 自带的字典或者列表快很多安装一般anaconda环境会自带numpyNumpy的安装文件地址是这里。里面有不同版本,有开发者版本和稳定版...原创 2018-08-02 15:41:27 · 349 阅读 · 0 评论 -
GloVe学习笔记
GloVe是一种用于获取词汇向量表示的无监督学习算法。 对来自语料库的聚合全局字词同现统计进行训练,并且所得到的表示展示了词向量空间的有趣的线性子结构。官网主页地址:https://nlp.stanford.edu/projects/glove/Github:https://github.com/stanfordnlp/GloVe论文下载地址:https://nlp.stanford....原创 2018-04-20 16:45:39 · 2283 阅读 · 0 评论 -
Google Colab免费GPU配置方法
前言因为最近在Mac上跑模型实在是心累,所以就想要找一些免费的云服务器来进行模型训练经了解,Google推出的免费GPU服务器Google Colab(Colaboratory)就很合适Google Colab特征Colaboratory是一个 Google 研究项目,旨在帮助传播机器学习培训和研究成果。它是一个Jupyter Notebook环境,不需要进行任何设置就可以使...原创 2018-03-13 16:57:42 · 9113 阅读 · 3 评论 -
“智能问诊”项目——机器学习(1)
经过对各种机器学习算法的初步了解,我最终选定了word2vec来实现药品推荐的功能word2vec是word embedding(词向量)的一种浅层神经网络训练方法。word embedding的这一系列的训练方法,都有一个有趣的现象,那就是训练的主要目标居然是获得side effect的词向量,而不是神经网络的预测模型。这是一种Transfer Learning的思想。这种思想非常值得学原创 2017-08-06 19:13:25 · 2202 阅读 · 5 评论 -
“智能问诊”项目——数据获取(3)
用之前获取到的数据对word2vec进行训练时发现得到的模型并不理想,所以为了使模型更加精确,我决定增加数据量继续进行训练要从哪里获取大量的数据就是一个很头疼的事了,我一直没有很好的解决方案,直到昨天另外一个项目组开会时一个学长的方案给了我很大启发这里数据的来源就是百度百科,经过观察很容易发现,百度百科有一个特点,其不同词条前半部分URL是相同的,都是https://baike.baidu原创 2017-08-08 16:44:12 · 1775 阅读 · 0 评论 -
Python中gensim库word2vec的使用
Python中gensim库word2vec的使用:pip install gensim安装好库后,即可导入使用:1、训练模型定义from gensim.models import Word2Vec model = Word2Vec(sentences, sg=1, size=100, window=5, min_count=5, negative=3, sample=0....原创 2017-08-09 16:23:52 · 19547 阅读 · 4 评论 -
CS224n学习笔记
CS224n学习笔记CS224n: Natural Language Processing with Deep Learning代码及笔记在 https://github.com/AngusMonroe/CS224n 持续更新原创 2019-02-10 13:59:27 · 372 阅读 · 0 评论