自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 判别式模型与生成式模型

判别式模型与生成式模型机器学习模型有两个重要类别:判别式模型与生成式模型。这两种模型的区别,是很多初学者会遇到的一个坎儿。判别式模型的意思是,给出一条数据,模型要为数据给出一个类别。一般来说,数据是比较复杂的,比如一句话、一张图这样的;类别则比较简单,一般就是「是」或「否」,或者有限的几个类别。用 X 表示数据,Y 表示类别,则判别式模型建模的就是 P(Y|X)。至于 X 本身的分布是怎样...

2019-07-25 10:27:37 236

原创 tensorflow1.0

https://blog.csdn.net/xzy_thu/article/details/762206541、 tf.InteractiveSession():tf.InteractiveSession():它能让你在运行图的时候,插入一些计算图,这些计算图是由某些操作(operations)构成的。这对于工作在交互式环境中的人们来说非常便利,比如使用IPython。tf.Sessi...

2019-07-22 13:55:12 259

原创 pandas 读取csv 按行读取

import pandas as pdcsvfile = open('text.csv',encoding='utf-8')df = pd.read_csv(csvfile,engine='python')# 按行读取保存到字典里,假设每行有三个字段,item_id,info,titledict_item_id = {}dict_info = {}dict_title = {}di...

2019-07-18 11:05:12 30457

原创 gensim 实现tfidf 之语料的流式加载

有37万个文本数据来生成tfidf模型,如果直接一次性放入内存,会出现MemoryErrorgensim实现了流式加载语料的功能,故定义迭代器完成语料的载入。生成字典过程中,遍历file文件,每个处理一个文本数据。import warningswarnings.filterwarnings(action='ignore',category=UserWarning,module='g...

2019-07-09 13:14:54 1369 3

KDD Cup 2012 Track1 数据集

KDD Cup 2012 Track1 数据集。数据集包含了用户特征和Item特征。文件为百度云链接。可快速下载。

2019-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除