- 博客(9)
- 收藏
- 关注
原创 Java基础-多线程
Executors创建线程池(底层都是通过ThreadPoolExecutor创建的线程池对象)Thread类海提供了:yield、interrupt、守护线程、线程优先级等线程的控制方法。加锁(每次只允许一个线程加锁,加锁后才能进入访问,访问完毕后自动解锁,然后其他进程才能进入)大型并发系统环境中使用Executors如果不注意可能出现系统风险(默认参数无法自定义)Java是通过java.lang.Thread类的对象来代表线程的。join() (让调用当前这个方法的线程先执行完)
2024-10-20 22:08:12
903
原创 【推荐系统】王树森推荐系统公开课自学笔记8-涨指标的方法
是最核心的指标目前工业界最常用衡量留存。t0t0−t6其他核心指标:用户使用时长、总阅读数/总点击数、总曝光数。非核心指标:点击率、交互率等等。对于UGC平台,发布量和发布渗透率也是核心指标。
2024-10-16 14:07:42
1196
原创 【推荐系统】王树森推荐系统公开课自学笔记7-物品冷启动
Q:为什么要特殊对待新笔记?A:新笔记缺少与用户的交互,导致推荐的难度大、效果差;扶持新发布、低曝光的笔记,可以增加作者发布意愿。
2024-10-16 12:51:54
1167
原创 【推荐系统】王树森推荐系统公开课自学笔记6-多样性
基于物品的(类目、品牌、关键词等)基于物品的提升多样性的方法(排序后的结果既需要高排序分数,也需要多样性)精排的后处理通常称为重排。
2024-10-15 00:00:19
616
原创 【推荐系统】王树森推荐系统公开课自学笔记4-交叉结构
线性模型:p=b+∑i=1dwixip=b+\sum_{i=1}^dw_ix_ip=b+∑i=1dwixi二阶交叉特征:p=b+∑i=1dwixi+∑i=1d∑j=i+1duijxixjp=b+\sum_{i=1}^dw_ix_i+\sum_{i=1}^d\sum_{j=i+1}^du_{ij}x_ix_jp=b+∑i=1dwixi+∑i=1d∑j=i+1duijxixjFactorized Machine(FM):p=b+∑i=1dwixi+∑i=1d∑j=i+1d(viTvj)xi
2024-10-11 20:14:41
1158
原创 【推荐系统】王树森推荐系统公开课自学笔记3-排序
先输入共享神经网络(share bottom),输出头是全连接层+Sigmoid,输出排序依据的预估值。二元分类方法:定义完播指标(例如完播80%定义为正样本,否则为负样本),最后的结果是二元分类的概率。训练时看成二元分类任务,使用交叉熵损失函数,总的损失函数是加权和。
2024-10-10 12:29:13
789
原创 【推荐系统】王树森推荐系统公开课自学笔记2-召回
量化用户对物品的兴趣likeuseritemj;量化物品之间的相似度simitemjitem;
2024-10-09 22:55:18
887
原创 【推荐系统】王树森推荐系统公开课自学笔记1-基础知识
因此,下一步是做线上的小流量A/B测试,考察新的召回通道对线上指标的影响。模型中有些参数,比如模型的超参数,需要用A/B测试选取最优参数。取10%的用户作为holdout桶,推荐系统使用剩余90%的用户做实验,两者互斥。召回(大规模筛选)、粗排(挑选评分高的)、精排(高精度深度模型,可能有截断,也可能没有)、重排(随机抽样,相似内容打散)如果业务指标的diff显著增加,则可以推全到90%,考核周期结束后,推全到100%。有的指标(点击、交互)立刻受到新策略影响,有的指标(留存)存在滞后性,需要长期观测。
2024-10-08 21:08:25
615
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人