- 博客(3)
- 收藏
- 关注
原创 TensorFlow中的损失函数
分类问题和回归问题是监督学习的两大种类,本文将分别介绍分类问题和回归问题中使用到的经典损失函数以及根据实际情况所自定义的损失函数。同时注意损失函数定义的是损失,所以要将利润最大化,定义损失函数应该刻画成本或者代价。在实际情况中,可以根据具体问题自定义损失函数。一、经典损失函数1、分类问题1.1、交叉熵简介机器学习中,在解决二分类的情况时,可以通过设置一个阈值,大于阈值的认为是一类,小于阈...
2018-11-20 19:36:56 509
原创 jiaba库之关键词提取(增量更新自定义语料)
一、提取语句关键词在自然语言处理中,经常会遇见对文章或者信件进行关键词提取。而jiaba库正给我们提供了两种简单的关键词提取方法(TF-idf与TextRank)。本文不讲这两方式提取关键词的原理,只注重如何实现。在Python中,短短四个语句就能实现关键词的提取,我们所使用的文本数据为《红楼梦》中的某个章节。第二回 贾夫人仙逝扬州城 冷子兴演说荣国府 诗云 一局输赢料不真,香销茶尽尚...
2018-11-14 22:33:54 5209 2
原创 Word2Vec模型增量训练
一、 问题由来word2vec的本质是一个神经网络语言模型,基于语言模型进行分布式词向量的训练。它需要大量的语料进行训练,从而找到词与词之间的关系,但是当我们已经训练好了一个word2vec模型之后,数据库中又新流动进来了很多语料,我们应该在怎么办呢?我们不可能又基于所有语料重新训练一遍(当语料过大时,太耗费时间了),这时候,增量训练就派上了用场。二、word2vec模型的增量训练impor...
2018-11-13 18:50:44 13062 12
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人