自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 TF-IDF与TextRank

TF-IDFTF_IDF(Term Frequency/Inverse Document Frequency)是信息检索领域非常重要的搜索词重要性度量;用以衡量一个关键词w对于查询(Query,可看作文档)所能提供的信息。TF-IDF是两个指标的乘积:词频和逆文档频率。词频(Term Frequency, TF)表示关键词w在文档DiD_iDi​中出现的频率:TFw,Di=count(w)∣Di∣TF_{w,D_i}=\frac{count(w)}{|D_i|}TFw,Di​​=∣Di​∣count(

2021-02-07 19:53:38 550

原创 拉普拉斯矩阵 拉普拉斯算子 图论

图函数我们知道,互相连接的节点可以构成一个图,其中包含所有节点构成的集合V,和所有边构成的集合E。对于实数域上的函数y=f(x)y=f(x)y=f(x), 我们可以理解为一种对于x的映射,将每个可能的x∈Xx\in Xx∈X 映射到一个对应的y∈Yy\in Yy∈Y。相应地,我们也可以定义一个函数FG:V→RF_G: V \rightarrow RFG​:V→R,使得图上的每一个节点v∈Vv \in Vv∈V,都被映射到一个实数RRR上。图函数的梯度我们记得,梯度的意义在于,衡量函数在每一个点处,

2021-02-05 21:55:23 5737

原创 Keras 文本预处理 (Tokenizer的使用)

注: 部分内容参照keras中文文档Tokenizer文本标记实用类。该类允许使用两种方法向量化一个文本语料库: 将每个文本转化为一个整数序列(每个整数都是词典中标记的索引); 或者将其转化为一个向量,其中每个标记的系数可以是二进制值、词频、TF-IDF权重等。keras.preprocessing.text.Tokenizer(num_words=None, filters='!"#$%&()*+,-./:;<=

2020-08-02 17:48:18 4252

翻译 Kaggle dog vs cat —— 基于tensorflow.keras 的基本卷积神经网络模型(baseline)

小型卷积神经网络模型预训练的神经网络模型微调

2020-07-13 22:31:33 746

原创 扩展欧几里得算法的证明以及求逆元

在说扩展欧几里得算法之前,先说一下裴蜀定理。在数论中,裴蜀定理是一个关于最大公约数(或最大公约式)的定理:若a,b是整数,且gcd(a,b) = d,那么对于任意的整数x,y,ax+by = m中的m一定是d的倍数。一定存在整数x, y,使得 ax + by = gcd(a, b)证明1:因为gcd(a, b) = d,所以d|a, d|b, 又因为x, y是整数, 所以d|ax, d|by, 所以d|ax+by, 即 d|m。证明2:令s 为 ax + by 的最小正值,再令e = ma +

2020-05-22 05:35:25 933

原创 np.hstack(), np.concatenate()与np.stack()解析

np.hstack(),np.concatenate()与np.stack()是numpy中实现数组水平组合的三个函数。1. np.hsatck(arrays)np.hstack(arrays)是其中最简单的一个函数。它接收的参数是一个元组,包含需要组合在一起的几个数组。这些数组需要满足的要求是维数相同零轴元素个数相同例:a = np.arange(9).reshape(3, 3...

2020-02-06 12:07:29 4581 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除