自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Xiaozhu的博客

全力以赴,你会很酷!

  • 博客(3)
  • 收藏
  • 关注

原创 TensorFlow中的损失函数

分类问题和回归问题是监督学习的两大种类,本文将分别介绍分类问题和回归问题中使用到的经典损失函数以及根据实际情况所自定义的损失函数。同时注意损失函数定义的是损失,所以要将利润最大化,定义损失函数应该刻画成本或者代价。在实际情况中,可以根据具体问题自定义损失函数。一、经典损失函数1、分类问题1.1、交叉熵简介机器学习中,在解决二分类的情况时,可以通过设置一个阈值,大于阈值的认为是一类,小于阈...

2018-11-20 19:36:56 509

原创 jiaba库之关键词提取(增量更新自定义语料)

一、提取语句关键词在自然语言处理中,经常会遇见对文章或者信件进行关键词提取。而jiaba库正给我们提供了两种简单的关键词提取方法(TF-idf与TextRank)。本文不讲这两方式提取关键词的原理,只注重如何实现。在Python中,短短四个语句就能实现关键词的提取,我们所使用的文本数据为《红楼梦》中的某个章节。第二回 贾夫人仙逝扬州城 冷子兴演说荣国府  诗云  一局输赢料不真,香销茶尽尚...

2018-11-14 22:33:54 5209 2

原创 Word2Vec模型增量训练

一、 问题由来word2vec的本质是一个神经网络语言模型,基于语言模型进行分布式词向量的训练。它需要大量的语料进行训练,从而找到词与词之间的关系,但是当我们已经训练好了一个word2vec模型之后,数据库中又新流动进来了很多语料,我们应该在怎么办呢?我们不可能又基于所有语料重新训练一遍(当语料过大时,太耗费时间了),这时候,增量训练就派上了用场。二、word2vec模型的增量训练impor...

2018-11-13 18:50:44 13062 12

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除