机器学习
文章平均质量分 83
chencjiajy
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习基础:极大似然估计与交叉熵
极大似然法与交叉熵原创 2024-12-18 21:25:38 · 1205 阅读 · 0 评论 -
基于的图的异常检测算法OddBall
OddBall异常检测算法出自2010年的论文《OddBall: Spotting Anomalies in Weighted Graphs》,它是一个在加权图(weighted graph)上检测异常点的算法,基本思路为计算每一个点的一度邻域特征,然后在整个图上用这些特征拟合出一个函数,再根据拟合出来的参数计算每个点的异常分数,所以它可以用于无监督场景。原创 2024-11-16 16:23:58 · 1895 阅读 · 1 评论 -
经典异常检测算法LOF
异常检测算法LOF(local outlier factor)出自2000年的SIGMOD论文《LOF: Identifying Density-Based Local Outliers》,它包括k-近邻距离、可达距离、局部可达密度、局部异常因子等概念。原创 2024-11-16 16:12:26 · 1483 阅读 · 0 评论 -
无监督关键词提取算法:TF-IDF、TextRank、RAKE、YAKE、 keyBERT
无监督关键词提取算法:TF-IDF、TextRank、RAKE、YAKE、 keyBERT原创 2024-01-01 17:05:44 · 4425 阅读 · 0 评论 -
适用于在线学习的动态特征缩放方法
适用于在线学习的动态特征缩放方法原创 2023-10-22 17:38:53 · 355 阅读 · 0 评论 -
PU learning 算法笔记1-- 论文《Learning Classifiers from Only Positive and Unlabeled Data》中的方法
PU learning 算法笔记 -- 论文《Learning Classifiers from Only Positive and Unlabeled Data》中的方法。原创 2023-06-22 08:49:09 · 1376 阅读 · 0 评论 -
Pyspark 利用Pandas UDF 进行模型预测
当我们训练好了一个模型,想在大规模的数据上预测时,pyspark的Pandas UDF在加载模型并使用模型对数据进行分布式预测很有用原创 2023-03-05 20:31:54 · 1208 阅读 · 3 评论 -
分位数回归(Quantile regression)笔记
分位数回归(Quantile regression)是在给定X的条件下估计y的中位数或其他分位数, 这是与最小二乘法估计条件均值最大的不同。原创 2023-02-18 21:28:52 · 4204 阅读 · 0 评论
分享