自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

原创 风控如何应对呼啸而来的chatGPT?

ChatGPT,美国OpenAI 研发的通用任务聊天机器人 ,于2022年11月30日发布。ChatGPT能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、文案、翻译、代码、写论文等任务。

2023-03-01 16:22:45 4336

原创 【钟灵毓秀AI史】对比学习

对比学习是一种由有监督的思路去解决无监督的问题的一种方法。主流的思路是将一个样本进行变换,变换后的样本为正样本,样本集中其他样本及其他样本的变换定义为负样本。然后让正样本尽可能相似,与负样本尽可能远。梳理下发展史,不同算法的有点等待梳理下。对这个图进行了解,就能对整个对比学习的发展核心节点和方向有一个初步的概念。......

2022-07-10 09:01:06 889

原创 【Transformer系列】你需要的是Attention吗,MetaFormer介绍

Transformer提出时,作者认为效果好最重要的是注意力机制。然后MetaFormer证明Transformer的成功源于它的广义架构。

2022-06-29 19:51:24 660

原创 【优化算法】3. 学习率优化算法

文章目录概论基础牛顿法稀疏特征的学习率AdaGradAdadeltaRMSProp算法AdamYogi概论学习率(learning rate)决定目标函数能否收敛到最小值,和何时收敛到最小值。如果直接设定一个学习率η,是一个很棘手的问题。学习率η设定太小,算法就会进展缓慢,设定太大,就会震荡或者发散。针对这样的问题,就产生了学习率自适应算法。基础牛顿法函数f:Rd→Rf: \mathbb{R}^d \rightarrow \mathbb{R}f:Rd→R的泰勒展开式,事实上我们可以把它写成f(x

2022-04-24 19:22:59 1836

原创 【QLIB】 GBDT模型输出因子重要性

GBDT是有较好解释性的,我们可以通过模型获取到因子的重要程度。修改qlib/contrib/model/gbdt.py。增加方法,按照因子重要程度进行排序 def importance(self, importance, columns): df = pd.DataFrame({'feature': columns, 'importance': importance}) df.sort_values('importance',inplace=True,asce

2022-04-20 11:50:30 2231

原创 【优化算法】2. 梯度下降优化算法

文章目录概论随机梯度下降小批量随机梯度下降动量法泄漏平均值梯度加速算法概论梯度下降不会直接用于深度学习,在生产环境中,会使用梯度下降的优化算法深度学习中的目标函数通常是训练集中每个样本的损失函数平均值。给定nnn个样本的训练数据集,假设fi(x)f_i(x)fi​(x)是第iii个训练样本的损失函数,其中XXX是参数向量。然后我们得到目标函数f(X)=1n∑i=1nfi(X)f(X) = \frac{1}{n}\sum_{i=1}^nf_i(X)f(X)=n1​i=1∑n​fi​(X)XXX的目标

2022-04-19 19:35:44 344

原创 【优化算法】1. 深度学习优化算法介绍

文章目录概论优化的目标优化的挑战局部最小值鞍点梯度消失总结概论本文主要介绍深度学习与优化的关系,以及优化在深度学习使用中的问题和挑战。解决一个深度学习问题的基本步骤:定义损失函数。使用优化算法最小化损失。优化过程中,损失函数就是优化算法的目标函数。通常我们优化的目标是最小化,当遇到最大化问题时,我们可以给目标函数加个负号。优化的目标虽然优化算法是深度学习中用来减少损失函数的方法,但是优化算法和深度学习的目标是不同的。优化的目标是减少训练误差,最小化目标函数是基于训练集的损失函数。深度

2022-04-13 19:32:30 2004

原创 梯度下降详解

文章目录概论理论基础导数和微分偏导数梯度链式法则梯度下降数学定义一维梯度下降学习率局部最小多元梯度下降总结参考资料概论梯度下降(Gradient Descent GD)是用来寻求损失函数(loss function)最小化的方法,最为常用随机梯度下降(stochastic gradient descent)SGD,几乎可以解决除了决策树之外所有算法的损失函数最小化问题。比较通俗的例子是一个人站在山顶,为了尽快下山,这个人需要寻找当前位置最为陡峭的方向往下走。另一个更好的例子是山泉流入山谷的过程。

2022-04-12 19:05:18 1120

原创 【风控系列】7. 内容风控的分级分类

文章目录概论核心分类涉黄广告专项分类未成年专项总结概论内容风控是每一个具备UGC功能应用所必须的,主流社区中内容风险约占业务风险总量的10%-20%,控制好内容风险,对应用的用户体验也会有所提升。目前主流的做法是对内容进行分级分类,然后对各个分类进行识别。主流的内容风险,有以下几种核心分类:涉黄、涉政、违禁、暴恐、谩骂、广告、灌水等。专项分类:未成年、低价值、多语言、广告法、商标法、饭圈等。核心分类核心分类主要介绍下涉黄、广告。涉黄涉黄通常是ugc中最常出现的问题,主要原因是黑产较为成

2022-04-11 15:56:12 1336

原创 什么是量化系统

概论近年来,量化交易在国内金融市场得到了快速发展,据统计,目前量化交易成交在A股市场占比20%-30%之间,不过相比美国市场的70%,国内量化还有很大的发展空间。股票量化主要内容包括选股、择时、投资组合、风险控制、资金管理。选股选股一般要考虑两个因素基本面和市场行为。基本面包括多因子模型、风格轮动模型和行业轮动模型。市场行为包括一致性模型、趋势追踪模型、资金流模型、动量反转模型、筹码选股模型等。Alpha策略有:多因子、风格轮动、行业轮动、资金流、动量反转等。多因子多因子模型是目前应用最多的一

2022-04-04 22:59:34 850

原创 【风控系列】6.简单有效的社区风控算法

文章目录1. 概论2. 文本算法3. 图像算法4. 行为算法5. 标注问题总结风控系列文章目录1. 概论​ 社区是人与人交流的平台,是现代人生活中不和缺少的部分,一个社区需要引导好舆论的风向和价值观,鼓励正向内容的传播,抑制与社会和产品价值观相背的内容和行为,社区应该把价值观作为重要的因素加入到核心业务目标中。​ 那社区风险又是什么,我定义是,违反法律法规和相关政策,或者影响整体用户体验的内容和行为。风险主要分为两类内容风险和行为风险。2. 文本算法正则正则是比较基础有效的工具,可以应用在在

2022-04-03 20:26:10 1545

原创 【风控系列】0.目录

【风控系列】1. 风控概论【风控系列】2. 如何构建一个有效的风控系统【风控系列】3. 高效的风控业务流程【风控系列】4. 行之有效的风控业务目标【风控系列】5.风控规则谁来主导,产品还是运营?...

2022-04-02 14:58:07 421

原创 【风控系列】5.风控规则谁来主导,产品还是运营?

文章目录概论规则引擎特征计算处置系统规则配置专家系统概论规则引擎是风控的总控。一个成熟的风控系统,规则引擎几乎要承担所有的决策。规则引擎的目标用户是产品和运营,那产品和运营的边界在哪里,我认为规则80%以上由运营来制定,产品要做的是给运营足够的授权和降低规则引擎的使用难度。规则引擎、策略配置、特征计算、专家系统、处置系统等问题的边界怎么定义才能使得系统更为高效,这里阐述下我的理解。规则引擎规则引擎是将输入的特征集合和规则集合进行计算,从而触发一个或者多个业务操作。从这里看规则引擎包括三个部分:输

2022-04-02 14:30:56 704

原创 【风控系列】4. 行之有效的风控业务目标

文章目录1. 概论2. 核心指标2.1 客诉量2.2 审核效率2.3 通报量3. 细粒度指标4. 垂直指标4.1 竞品效果对比4.2 效果验证4.3 特殊场景成长型指标5. 总结1. 概论​ 目标的重要性这里就不说了,目标考核不管是KPI还是OKR,目标都是需要量化的。设定目标可以概括为明确场景,确定核心指标,并以细粒度的指标拟合长期核心的指标。这个过程就需要我们构建一个指标体系。​ 指标可以分成成长型的和非成长型的。成长型如DAU、CTR,是会伴随着公司成长而成长的,且正相关,成长型很容易得到大家

2022-04-01 19:24:02 565

原创 【风控系列】3. 高效的风控业务流程

文章目录概论业务流程风控产品参考概论风控工作的核心是产品,或者说每个公司的核心都是产品。产品的研发也是有方法论的,产品研发体系(IPD)。一个体系是靠流程运转起来的,流程需要各个角色在工作中不断迭代形成的,是一个产品能否有竞争里的底层逻辑。风控中普遍涉及的流程有审核流程、巡检流程、专项治理流程、紧急事件处理流程。业务流程构建一个完整风控的业务流程包括标准、流程、工具、数据四个部分。标准:构建一个流程,首先要制定相关的标准和原则。比如审核流程需要制定风险的类别及定义,并进行相关人员培训,否则每个

2022-03-31 17:43:37 1001

原创 【风控系列】2. 如何构建一个有效的风控系统

文章目录0. 背景1. 第一代系统1.1 目标1.2 框架1.3 功能说明2. 第二代系统2.1 目标2.2 框架2.3 功能说明3. 第三代系统3.1 目标3.2 框架3.3 功能说明4. 第四代系统4.1 目标4.2 框架4.3 功能说明汇总参考0. 背景目前国内已经很多优秀的风控服务商,如同盾科技、数美科技、网易易盾等。本文根据自己的理解,给出了从头构建一个完整风控系统的一个思路。共分为了4个阶段,每个阶段根据不同的目标,实现不同的功能。下面进行具体的描述。1. 第一代系统第一代系统框架。1

2022-03-30 17:21:53 2112

原创 【风控系列】1. 风控概论

1. 风控概论​ 风控在不同行业的定义不同,这里主要是讨论互联网公司中反作弊、反欺诈、反垃圾等相关的工作。这些风控工作要对抗的目标也是包括多种多样,我在这里将对抗的目标分为两大类:个体风险和聚集风险。个体风险主要指单个个体就能产生风险的问题,比如骗贷、涉政。聚集风险,包括各类黑产,比如社区垃圾、薅羊毛等,这种往往呈现出一定的规模,才会形成风险。我们对问题简单化进行假设和定义,有利于方案的构建。2. 解决方案​ 要建设一个健全的风控解决方案,方案包括流程和系统。流程是将工作进行标准化和流程化,把风

2022-03-29 16:47:45 543

原创 QLIB使用tushare更新每日行情

0. 介绍qlib每日数据的源是yahoo,更新速度较慢并且不稳定。tushare每日行情是免费接口,速度较快。1. 获取行情数据,保存为csv格式。def GetDataFromTushare(self, today, fpath): pro = ts.pro_api() df = pro.daily(trade_date=today) for index, row in df.iterrows(): code = row['ts_code']

2022-03-22 15:35:57 1975 3

原创 图卷积神经网络GCN

GNN1. 基础知识1.1 Spatial Domain(空间/拓扑域)和Spectral Domain(谱域)1.2 拉普拉斯矩阵1.3 三级目录1. 基础知识1.1 Spatial Domain(空间/拓扑域)和Spectral Domain(谱域)1.2 拉普拉斯矩阵1.3 三级目录

2021-02-24 15:21:57 179

原创 一文读懂「Attention is All You Need」

一文读懂「Attention is All You Need」1. 介绍2. 模型架构2.1 Encoder-Decoder 框架2.1.1 Encoder模块2.1.2 Decoder模块2.1.3 Attention模块2.2 Position-wise Feed-Forward 网络2.3 Embeddings and Softmax2.4 Positional Encoding2.5 Full Model3. 模型训练1. 介绍核心Transformer,Transformer抽象结构如图。

2021-01-18 18:58:10 724

原创 一文读懂Attention

@[TOC] 一文读懂AttentionAttention本质是什么Attention(注意力)机制模仿了生物观察行为的内部过程,核心逻辑就是从关注全局到关注重点。如人的视觉在处理一张图片时,会通过快速扫描全局图像,获得需要重点关注的目标区域,也就是注意力焦点。然后对注意力焦点投入更多的注意力资源,以获得更多所需要关注的目标的细节信息,并抑制其它无用信息。Encoder-Decoder框架要理解Attention机制,就需要先介绍下Encoder-Decoder框架,因为大多数的注意力模型是依附于该

2021-01-12 18:17:49 372

原创 dataframe操作

dataframe操作dataframe连接>>> a = np.zeros((3,4))>>> b = np.ones((3,4))>>> d= pd.DataFrame(a)>>> d 0 1 2 30 0.0 0.0 0.0 0.01 0.0 0.0 0.0 0.02 0.0 0.0 0.0 0.0>>> e = pd.DataFrame

2020-12-08 16:38:40 92

原创 ELK 集群配置

ELK 集群配置创建networkdocker network create somenetworkelasticsearch1# This commands should be executed on my host machine with IP 10.0.0.1sudo docker run -d --name elasticsearch --net somenetwork -p 9200:9200 -p 9300:9300 \-e "discovery.seed_hosts=10.0.

2020-11-04 16:08:35 136

原创 GO docker 部署

GO docker 部署编辑Dockerfile第一种 直接编译执行第二种 配置docker-compose.yml ,再执行编辑DockerfileFROM golang:1.15 AS builderENV GO111MODULE=on \ GOPROXY=https://goproxy.cn,direct \ CGO_ENABLED=0 \ GOARCH=amd64# 移动到工作目录:/buildWORKDIR /buildCOPY go.mod .COPY

2020-09-30 10:34:52 219

原创 golang 中文处理

golang 中文处理查看字符串方式1方式2Golang 文本长度子字符串引用查看字符串方式1 const nihongo = "日本語" for index, runeValue := range nihongo { fmt.Printf("%#U starts at byte position %d\n", runeValue, index) }方式2 const nihongo = "日本語" for i, w := 0, 0; i &

2020-09-29 19:52:44 710

ffm及deepffm模型在推荐系统的探索及实践-张俊林-v7-终版.pdf

deepfm模型分享,ffm及deepffm模型在推荐系统的探索及实践-张俊林-v7-终版,微博在热门微博等业务中ffm模型的实践。

2020-01-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除