- 博客(3)
- 收藏
- 关注
原创 【Latex】重新编译后段落间距变大的解决办法
解决办法: 在begin{document}前使用命令\raggedbottom原因: 重新编译后,有的模板会重拍页面分布使得下一个标题出现在第二页的第一行,前一页的空白部分通过拉长段落间距来填补,\raggedbottom使得空白都置于前一页底部。参考: https://latexref.xyz/_005craggedbottom.html...
2022-04-25 21:52:30
8815
4
原创 MapReduce的关系代数运算
关系代数概念R(A1,A2,...,An)R(A_1,A_2,...,A_n)R(A1,A2,...,An)表示关系的名称是RRR,其属性是A1,A2,...,AnA_1,A_2,...,A_nA1,A2,...,An。例如Link关系中有两个属性From和To,一个元组(url1,url2)(url1,url2)(url1,url2)表示从链接1指向链接2。选择(selection) 筛选关系R中符合条件C的元组,记为:σC(R)\sigma_C(R)σC(R)。投影(proje
2022-02-08 19:51:08
2160
原创 TF.IDF指标
定义度量给定词语在少数文档中反复出现程度的形式化指标称为TF.IDF。TF(term frequency): 词项频率。IDF(inverse document frequency): 逆文档频率。TF.IDF 为二者的乘积。计算方法文档集中有NNN 篇文档,fijf_{ij}fij为词项iii在文档jjj中出现的次数,则TFij=fijmaxkfkjTF_{ij}=\frac{f_{ij}}{max_kf_{kj}}TFij=maxkfkjfij即归一化处理,除以文档jjj中最高
2022-02-05 12:03:17
1082
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人