- 博客(11)
- 收藏
- 关注
原创 推荐系统实践读书笔记
推荐系统实践读书笔记一、推荐系统实验方法1. 离线实验推荐算法在样本上的表现(准确率, 召回率,auc等);优点:不需要实际推荐系统的控制权,速度快;缺点:无法计算业务关注的真实指标,离线结果与线上存在差距;2. 用户调查通常为用户问卷调查优点:能够体现用户真实的兴趣;缺点:成本较高;3. 在线实验AB实验优点:能够获取真实的业务数据;缺点:需要保证AB同质,但实际中对照组和实验组通常存在相互干扰;二、推荐算法的评价指标用户满意度(问卷反馈,点击率,转化率,停留时
2021-12-11 15:46:08 905
原创 c++知识点总结
struct与class的联系和区别* 联系:c++支持struct和class定义类型,struct是从c语言继承过来的;* 区别:1)默认继承级别不同:class保留字定义的派生类默认具有private继承,而用struct保留字定义的类默认具有public继承;2)一般来说只有数据时候使用struct,其它一概使用class;3)C中的struct和C++中的struct之间的区别是C是一种过程化的语言,struct只是作为一种复杂数据类型定义,struct中只能定义成员变量,不能定义...
2021-05-09 18:53:49 113
原创 LTR学习笔记
1.常见的LTR模型1.1 pointwise模型该方法只考虑给定查询下,单个文档的绝对相关度,而不考虑其他文档和给定查询的相关度。把排序问题当作分类或者回归问题来处理。输入:{(q_i, x_ik, label_ik)} 其中q_i表示第i个query,x_ik表示query对应的doc的第k个特征组合,label_ik表示人工标注的表示query与url之间的匹配程度的分值损失函数:L={l(f(x_ik), label_ik}(k=1,2,3…n), 一般为交叉熵损失函数或者RMSE函数
2021-05-07 21:03:12 1453
原创 leetcode——判断输入的字符串是否可以表示数值
ps:不太明白为什么isInter(const char** str)要用指针的指针,跪求各位大神解答。// 判断输入的字符是否可以表示数值// 该题需要考虑整数,小数,指数类型的输入// 当字符串中出现0~9的数字时,返回truebool isUnsignedInt(const char** str) { const char* before = *str; while(**str != '\0' && **str >= '0' && **
2021-05-02 18:34:21 182
原创 leetcode——字符串转整数
该题主要考虑特殊情况:非法输入——比如"1+2"空字符串与’0’——二者的返回值均为0,需要一个全局变量来区分非法输入(空字符串属于非法输入)数字溢出——最大正整数为0x7FFFFFFF,最小负整数为0x80000000,如果溢出,返回0,并标记为非法输入。// 把字符串转换为整数// 空字符串返回值为0,输入为'0'时,返回值也为0,因此需要全局变量来区分enum status {VALID = 0, INVLID};int g_status = VALID;
2021-05-02 17:52:42 123
原创 leetcode——打印从1到最大的n位数
打印从1到最大的n位数, 考虑数组越界,大数问题——字符串 // 返回数字是否越界 bool Increment(char* number) { bool is_over_flow = false; int length = strlen(number); int add_next = 0; // 取值为0,1,表示是否进位 // 从最低位开始遍历 for(int i = length - 1; i >= 0; i--) { in
2021-05-01 19:03:05 122
原创 信息检索导论---第四章读书笔记
信息检索导论—第四章读书笔记第四章 构建索引一、硬件相关概念扇区是磁盘中最小的物理存储单元操作系统将相邻的扇区组合在一起,形成一个数据块,对块进行管理,每个块包含2,4,8,16,32或64个扇区数据块是逻辑概念,而非物理概念。一个数据块只能放一个文件,因此文件的实际大小是小于等于所占的存储空间大小的。操作系统往往以数据块为单位进行读写,因此,读取一个字节可能和读取一个数据块耗费的时间一样进行磁盘读写时,需要将磁头移到数据所在的磁道,该过程耗费的时间称为寻道时间。寻道时间一般在5ms左右
2020-10-25 22:38:16 323
原创 Linux每天一点积累
wc 计算文件的Byte数、字数、或是列数-l 统计文件的行数,可能会出现行数统计不符合真实值的情况,因为wc -l只统计newline的行数,newline可以理解为换行符awk https://www.cnblogs.com/yaohong/p/9163471.html2.1 打印一个文件中第20行到30行第1列的数据,#print $a取列#NR取行数—— awk ‘{if(NR>=20 && NR<=30) print $1}’ test.txt2.2 ..
2020-09-19 10:51:38 190
原创 Attention is all you need ---阅读笔记
<< Attention is all you need >>阅读笔记实验环境:实验细节:1.输入层编码2.多头注意力层3.layer norm4.残差连接5.全连接层(FFN)6.标签平滑常用函数参考链接 Transformer模型打破了传统的RNN的时序限制,引入自注意力机制,可以更好的对句子进行编码,关于模型的理论...
2020-01-31 14:26:39 2028 2
原创 《数学之美》-----读后感
《数学之美》-----读后感1.如何衡量分词效果的好坏?2.如何构建网络爬虫?3.影响搜索引擎的因素4.余弦相似度在自然语言处理中的应用5.如何判断两个集合是否相同?6.密码7.解决噪音干扰(反作弊)的基本思路8.如何衡量搜索结果的权威性?9.数学模型的重要性10.拼音输入法11.哈希表的存储效率一般不超过50%?后记参考链接 一直以来都不喜欢...
2020-01-26 14:16:56 681
原创 利用jupyter notebook连接数据库
Python3.7连接mysql,presto,hivePython3.7连接mysql新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart...
2019-07-29 01:04:30 14706
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人