- 博客(160)
- 资源 (1)
- 收藏
- 关注
原创 矩阵特征值的意义
矩阵特征值在很多场景都会遇到,考研数学都是必考、很多理工类专业课,以及机器学习中应用十分广泛,究其意义究竟如何,这里给出了几个角度。
2022-10-11 15:22:23 5328
原创 声源级、接收电压灵敏度(接收带内响应)
1、 声源级(发射)定义:声轴上距声源1米处产生的声强相对于参考声强的分贝数。是声纳方程中定量描述声源辐列表内容射能力的项,用SL表示。计算公式:列表内容SL=Sv+20lgVSL=Sv+20lgV SL = Sv + 20\lg V 参数解释: Sv发送电压响应,通过查找换能器发射曲线得到,是基础。 V为发送电压,20lgV是增量。2、接收电压灵敏度( 接收灵敏...
2018-09-02 22:25:13 20187 2
原创 json保存文件乱码
参数 ensure_ascii=False 在使用 Python 的 JSON 库来序列化数据时起到关键的作用,尤其是当数据中含有非 ASCII 字符(如中文、日文、韩文等)的时候。
2024-07-12 14:27:59 390
原创 记sparse_encoding_size引发的一次惨痛教训
sparse_encoding_size为类别变量分桶数量,emb size 数量要==+1==
2024-01-20 17:12:39 353
原创 大话 triplet loss 损失函数
本文对triplet进行总结,hinge loss, triplet loss是一个东西,是不同领域的不同叫法
2023-06-14 15:20:46 237
原创 softmax之温度系数
相对于 argmax 这种直接取最大的「hardmax」,softmax 采用更温和的方式,将正确类别的概率一定程度地突显出来。而引入温度系数的本质目的,就是让 softmax 的 soft 程度变成可以调节的超参。
2023-06-09 15:48:20 2257 2
原创 向量相似搜索绕不开的局部敏感哈希
局部敏感哈希基本原理是低维空间保留高维空间相近距离关系的性质,将相邻的点落入同一个“桶”,这样在进行最邻近搜索时,仅需要在一个桶内或邻近几个桶内进行搜索,只需要保证每个桶内的元素个数保持在一个较小的范围内。
2023-06-09 15:10:22 643
原创 SIM:基于搜索的用户终身行为序列建模
有没有一种方案是直接列用用户原始的行为,而且能够解决上万长度的用户序列的耗时问题呢?一种解决方案便是本文将要介绍的Search-based User Interest Model
2023-06-09 11:56:25 1080
原创 多目标建模loss为什么最好同时收敛?
多目标的多个task如果收敛速度不一样,收敛慢的task会对收敛快的task产生一个梯度的拉扯,导致已经收敛的task被迫再次回到为收敛的状态,本文给出了原因和解决办法。
2023-06-08 18:15:31 685
原创 Faiss PQ 乘积量化
在ANN近似最近邻搜索中,向量量化方法又以乘积量化(PQ, Product Quantization)最为典型。结合例子对PQ乘积量化、倒排乘积量化(IVFPQ)做一种更加直观的解释。
2023-06-08 10:08:00 1168
原创 样本不平衡的解决办法
本文试图从交叉熵损失函数出发,分析数据不平衡问题,focal loss与交叉熵损失函数的对比,给出focal loss有效性的解释。
2023-05-31 11:58:00 534
原创 hive常见demo
1、插入demo数据table_name="table_name_xxx"dt='20220101'sql="insert overwrite table ${table_name} partition(dt=${dt})select *from ( select 1 as uv, 1 as expo, 1 as ia_num, 1 as click_num, 1 as read_duration, 1 as qianbao_ia, 1 as qianboa_
2022-05-20 15:24:55 332
树模型论文汇总.zip
2019-08-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人