- 博客(6)
- 资源 (10)
- 收藏
- 关注
原创 DSSM及其在搜索领域的应用
1.使用query和doc的语义向量的余弦距离计算相关度:R(Q,D)=cos(yQ,yD)=yQTyD∣∣yQ∣∣yD∣∣R(Q,D)=\cos(y_Q,y_D) = \frac{y_Q^{\mathrm{T}}y_D}{||y_Q|| y_D||}R(Q,D)=cos(yQ,yD)=∣∣yQ∣∣yD∣∣yQTyD...
2019-03-28 15:18:32 1067
原创 协同过滤I2I的简单实现
基于物品的协同过滤是目前业界应用最多的算法。可以通过下面公式定义物品的相似度:wi,j=∣N(i)∩N(j)∣∣N(i)∣∣N(j)∣w_{i,j}=\frac{|N(i) \cap N(j)|}{\sqrt{|N(i)||N(j)|}} wi,j=∣N(i)∣∣N(j)∣∣N(i)∩N(j)∣这里,分母∣N(i)∩N(j)∣|N(i) \cap N(j)|∣N(i)∩N(j)∣是同时...
2019-03-27 22:28:14 1741
原创 数据结构与算法基础
数据结构与算法栈栈是一种动态集合,它是一种LIFO(last in first out后进先出)结构。队列队列是一种动态集合,它是一种FIFO(first in first out先进先出)结构。树二叉树http://blog.51cto.com/ahalei/1425314 http://blog.51cto.com/ahalei/1427156...
2019-03-25 22:33:08 152
原创 概率论基础
概率论与数理统计等可能概率事件A发生的概率P(A)=A中包含的基本事件数S中基本事件的总数P(A)=A中包含的基本事件数S中基本事件的总数P(A) = \frac{A中包含的基本事件数}{S中基本事件的总数}例1 将一枚硬币抛掷三次。(1)设事件A1为“恰有一次出现正面”,求P(A1);(2)设事件A2为“至少又一次出现正面”,求P(A2)。解 (1)P(A1)=C1323...
2019-03-25 22:30:14 1476
原创 信息熵(Information Entropy)及其在电商搜索领域中的应用
信息熵是衡量分布的混乱程度或分散程度的一种度量。分布越分散(或者说分布越平均),信息熵就越大。分布越有序(或者说分布越集中),信息熵就越小。计算公式给定的样本集X的信息熵的公式:entropy=−∑i=1Cpilog2(pi)entropy = -\sum_{i=1}^{C} p_{i} log_{2} (p_{i})entropy=−i=1∑Cpilog2(pi)参数的含义: ...
2019-03-21 11:02:23 1211
原创 Power-law Distributions(幂律分布)
f(x)=ax−kf(x)=ax^{-k}f(x)=ax−kAn example power-law graph, being used to demonstrate ranking of popularity. To the right is the long tail, and to the left are the few that dominate (also known as the...
2019-03-03 11:57:50 16770
使用颜色纹理直方图来进行目标跟踪
2012-11-22
多目标行人检测
2012-11-22
PCA降维程序
2012-11-22
LAMP_HMM 隐马尔科夫模型
2012-05-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人