小曹小曹喜欢吃草-CSDN博客

原创新闻推荐系统【DAY1】

赛题简介赛题以新闻APP中的新闻推荐为背景，要求选手根据用户历史浏览点击新闻文章的数据信息预测用户未来点击行为，即用户的最后一次点击的新闻文章，测试集对最后一次点击行为进行了剔除。赛题数据赛题以预测用户未来点击新闻文章为任务，数据集报名后可见并可下载，该数据来自某新闻APP平台的用户交互数据，包括30万用户，近300万次点击，共36万多篇不同的新闻文章，同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性，将会从中抽取20万用户的点击日志数据作为训练集，5万用户的点击日志数据作为测

2022-04-25 06:27:03 1513

原创 Task01逻辑回归&线性回归

逻辑回归&线性回归

2021-12-16 02:39:15 1085

原创有关SQL

SQL进阶及工作中常用SQL1.工作中常用sql排行2.工作中常用sql小技巧3.SQL进阶(这是重点)1.关于null值null值常见问题null值克星(重点):1.工作中常用sql排行①group by(用来聚合也时常用来去重注意用groupby select 后要跟聚合字段)②where(SQL计算之前进行过滤,对性能是极大的提高,代码测试阶段where条件下尽量跟分区)③having(SQL计算之后进行过滤,它的使用会极大提升的代码的简洁性,同样它的功能十分强大)④时间函数(时间与我们息息

2021-06-16 21:09:39 276

转载基于统计学的方法.

1、概述异常检测的统计学方法的一般思想是：学习一个拟合给定数据集的生成模型，然后识别该模型低概率区域中的对象，把它们作为异常点。即利用统计学方法建立一个模型，然后考虑对象有多大可能符合该模型。根据如何指定和学习模型，异常检测的统计学方法可以划分为两个主要类型：参数方法和非参数方法。参数方法假定正常的数据对象被一个以Θ为参数的参数分布产生。该参数分布的概率密度函数f(x,Θ)给出对象x被该分布产生的概率。该值越小，x越可能是异常点。非参数方法并不假定先验统计模型，而是试图从输入数据确定模型。非参数方

2021-05-15 02:26:03 464

转载异常类别与检测

什么是异常检测异常检测（Outlier Detection），顾名思义，是识别与正常数据不同的数据，与预期行为差异大的数据。识别如信用卡欺诈，工业生产异常，网络流里的异常（网络侵入）等问题，针对的是少数的事件。1.1 异常的类别点异常（point anomalies）指的是少数个体实例是异常的，大多数个体实例是正常的，例如正常人与病人的健康指标；条件异常（conditional anomalies），又称上下文异常，指的是在特定情境下个体实例是异常的，在其他情境下都是正常的，例如在特定时间下的温度

2021-05-12 00:45:30 873

weixin_46180512的博客

原创新闻推荐系统【DAY1】

原创 Task01逻辑回归&线性回归

原创有关SQL

转载基于统计学的方法.

转载异常类别与检测

原创 Hive sql 易错点

原创 Baseline

原创 Task4 建模与调参

原创 TASK 3：特征工程

原创泰勒公式

原创两个重要极限及其推导过程

原创补充学习内容（数据挖掘：理论与算法）

原创 Task5 模型融合

原创 Task01：赛题理解

原创 Task2 数据分析

空空如也

空空如也