自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 计算广告系统学习路径记录

本文以互联网广告技术架构图为索引,展开记录本博客之后的更新路径,包括1)因果推断 (uplift建模)、2)广告反作弊、3)推荐算法(传统推荐算法、深度学习算法)、4)广告工程。同时还记录互联网广告的业务知识、上下游产业链等

2023-10-05 17:27:19 131

原创 模型评估方式

有监督-分类、回归模型;无监督模型的评估指标小结

2024-02-24 19:00:40 871

原创 计算广告中涉及的设备id:oaid、androidid、imei、idfa、caid

计算广告中的设备ID,以及简单的发展历史

2024-02-24 16:09:35 3269 2

原创 机器学习中的数据预处理方法

数据预处理方法:处理缺失数据、处理类别数据、划分训练数据集和测试数据集、保持相同的特征缩放

2024-01-28 15:21:26 924

原创 Git学习笔记

git使用方法,Git常用命令、分支操作、团队协作机制、github操作

2024-01-28 12:10:54 1475

原创 反作弊中的图算法_文章集合与摘要

反作弊中的图算法_目前的文章合集

2023-11-30 16:12:54 102

原创 特征选择方式

本文转载自以下文章。

2023-11-27 20:45:57 52

原创 反作弊中的无监督算法2_聚类的4种方式及典型算法

聚类的4种方式:1)基于原型的kmeans算法、2)基于密度的DBSCAN算法、3)基于概率模型的高斯混合模型、4)基于层次聚类的Louvain\GN算法

2023-11-27 20:39:23 267

原创 逻辑回归(Logistic Regression)_推荐_前深度学习时代的常用算法1

逻辑回归算法的原理、Python实现、sckitlearn参数说明

2023-11-21 17:33:50 79

原创 反作弊中的无监督算法1_孤立森林_算法原理及实现

互联网反作弊中的无监督算法_孤立森林的原理、python实例、参数说明

2023-11-21 17:30:10 263

原创 TensorFlow基础1_对张量的基础操作_用Dataset API构建流水线

TensorFlow中对张量的定义;对张量的操作:拆分(split)、堆叠(stack)、连接张量(concatenate);构建数据流水线的方式

2023-11-19 15:12:31 66

原创 uplift在营销领域建模的4种方法

介绍了因果推断在营销领域的应用方式——uplift建模,解释了4种建模方法和两种离线评估方式

2023-11-19 15:05:10 847 2

原创 王争《数据结构与算法之美》笔记_下篇

排序、查找、跳表、散列表、哈希算法、二叉树、图

2023-11-08 17:58:54 229

原创 广告反作弊思路分享

目前络产的产业链较成熟,作弊逃不开的两大要素——账号和设备,其背后都有完整的资源和服务链条,见图1。同时,由于广告投放还存在归因的步骤,因此,还有一种作弊手段为,媒体获得大量设备id发给广告主,抢夺归因的作弊手段,同见表1。(注意,根据国家的法律要求,设备指纹在生成ID的过程中,不可以使用用户的个人隐私信息,如通讯录、手机号码、短信等)[2]。注1:设备的指纹不是成不变的,会随着时代的发展,不断更新——如机新增的压感应功能,就会多个参数;TCP、IP头信息,如TTL、起IP地址、端号;

2023-11-08 17:24:10 426

原创 《因果推断的python实现》序言_Matheus Facure

《因果推断的Python实现》书籍大纲

2023-11-01 14:54:43 125

原创 用Python实现感知器学习算法

感知器原理+用Python实现一个感知器

2023-10-25 11:53:11 495

原创 因果推断、用户增长、广告系统 文章合集

本文持续收集一些与用户增长、广告投放相关的因果推断文章。(更新日期:2023-08-09)(更新日期:2021-07-08)

2023-10-01 17:25:00 83

原创 王争《数据结构与算法之美-基础篇》笔记_上篇

数据结构与算法之美,回顾基础数据结构及刷题的指导路径

2023-09-30 10:59:43 250 1

原创 《程序化广告实战》笔记_持续更新

《程序化广告实战》笔记

2023-08-20 17:08:47 202 2

原创 airflow定义一个pipeline的例子

调度工具airflow的pipeline例子

2023-04-09 15:25:23 97

原创 Linux文件与文件系统的压缩、打包

本篇笔记来自《鸟哥的Linux私房菜 基础篇》

2023-04-09 15:12:39 213

原创 Linux磁盘与文件系统的简单操作

本文笔记来自《鸟哥的Linux私房菜》第四版第7章。。好多东西没太理解,先记录一下用得上的。

2023-04-04 09:51:18 73

原创 Linux的文件与目录管理

linux的文件与目录管理

2023-04-01 16:59:32 51

原创 shell脚本学习笔记

shell是一个程序,用C语言编写,是用户和linux内核沟通的桥梁。它既是一种命令语言,又是一种解释性的编程语言。shell讲用户的指令翻译为二进制,传给内核处理。功能:将内容输出到默认显示设备echo命令的功能是在显示器上显示一段文字,起到一个提示的作用。功能说明:显示文字。语法echo [-ne][字符串]补充说明:echo会将输入的字符串送往标准输出。输出的字符串间以空白字符串隔开,并在最后加上换行号。-n 不要在最后自动换行。

2023-03-25 20:51:03 133

原创 Linux的文件权限与目录配置

linux的文件权限与目录配置

2023-03-25 20:48:04 741

原创 linux语句之首次登录与在线求助man page

linux首次登录与在线求助

2023-03-25 19:27:17 56

原创 《计算广告》笔记2_基础知识准备

本文笔记来源于刘鹏、王超的《计算广告》第二版第十章,本文非常粗略的记录了计算广告涉及到的3个领域:信息检索(InformationRetrieval,IR),最优化(optimization),机器学习(MachineLearning,ML)

2023-03-21 10:01:36 60

原创 《计算广告》笔记1_计算广告技术概览

本文笔记来源于刘鹏、王超的《计算广告》第二版第九章关键技术概览;通过个性化系统框架展开讲述计算广告系统涉及的优化目标和技术

2023-03-21 09:55:00 144

原创 flink5_自定义函数

自定义函数(UDF)可以用 JVM 语言(例如 Java 或 Scala)或 Python 实现,实现者可以在 UDF 中使用任意第三方库,本文聚焦于使用 JVM 语言开发自定义函数。原文档:https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/functions/udfs/

2023-03-10 22:22:41 433

原创 flink4_flink SQL

source表、连续查询、Sink表Regular Joins、Interval Joins、Temporal Joins

2023-03-10 22:17:43 280

原创 flink3_流式聚合和数据类型

flink流式聚合和数据类型

2023-03-10 22:15:30 60

原创 flink2_流式概念

apache Flink文档中关于流式概念的部分

2023-03-04 14:11:01 66

原创 flink1-概念

flink中文文档学习笔记1-一些基本概念

2023-03-04 14:03:48 78

转载 hive的数据存储与压缩

本文梳理一下hive表的存储与压缩方式

2023-03-04 13:51:52 294

原创 《信息流广告入门》学习笔记

宁阿姨《信息流广告入门》学习笔记

2023-02-25 10:19:44 6442

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除