自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 梯度消失和梯度爆炸

可能原因:1、training sample中出现了脏数据,或输入数据未进行归一化2、学习速率过大,梯度值过大,产生梯度爆炸;3、在某些涉及指数计算,可能最后算得值为INF(无穷)(比如不做其他处理的softmax中分子分母需要计算exp(x),值过大,最后可能为INF/INF,得到NaN,此时你要确认你使用的softmax中在计算exp(x)做了相关处理(比如减去最大值等等));4、不当的损失函数(尤其是自定义的损失函数时);

2024-03-10 17:06:07 902

原创 ATTENTION机制

attention机制和transformer

2022-12-20 15:39:13 398 1

原创 TensorFlow2.0教程-用keras构建自己的网络层

TensorFlow2.0教程-用keras构建自己的网络层

2022-12-20 14:35:16 282

原创 DCN V2 & DCN 模型结构

DCN V2 && DCN 模型结构

2022-12-17 00:20:08 617

原创 样本负采样为什么不影响AUC计算?

AUC 指标为什么对于正负样本比例不敏感?线上线下效果不一致有哪些原因?

2022-12-16 21:24:02 813

原创 正则表达式

10分钟快速掌握正则表达式_哔哩哔哩_bilibili​​​​​​https://regex101.comananli​​​​​​​案例:限定符used? ab*c ab+c ab{6}c ab{2,6}c ab{2,}c (ab)+或运算符、字符类a (cat|dog) [abc]+ [a-zA-Z0-9] [^0-9]+元字符\d \w \s \D \W \S . 任意字符 ^a a$贪婪匹配和懒惰匹配?<.*>贪婪

2022-04-09 09:52:03 663

原创 机器学习——梯度下降法&优化器

目录梯度下降方法:SGD,Momentum,AdaGrad,RMSProp,Adam概述批量梯度下降法(Batch gradient descent)随机梯度下降法(Stochastic gradient descent)小批量梯度下降在线学习映射化简和数据并行冲量梯度下降,Momentum:其他三种经典的梯度下降方法梯度下降方法:SGD,Momentum,AdaGrad,RMSProp,Adam参考链接:https://blog.csd...

2021-04-05 16:55:28 1562

原创 机器学习——机器学习项目ML解决方案

《Hands-On Machine Learning with Scikit-Learn and TensorFlow》https://book.douban.com/review/8814479/目录Machine Learning Project ChecklistFrame the Problem and Look at the Big PictureGet the DataExplore the DataPrepare the DataShort-List Promi

2021-03-28 19:37:25 261

原创 《数据挖掘与数据化运营实战》

《数据挖掘与数据化运营实战——思路、方法、技巧与应用》数据分析的核心能力综合体:商业理解、数据分析、商业应用思考产品经理:善于总结、善于提炼、善于推而广之、善于把自己的分析“产品化”。数据挖掘商业实践的有效成长之路:“以业务为核心、以思路为重点、以挖掘技术为辅助”...

2021-02-08 17:52:02 342

原创 深度学习-keras & Tensorflow

Kerashttps://keras.io/zh/https://keras-cn.readthedocs.io/en/latest/

2021-01-29 09:42:18 174

原创 横向扩展——项目管理基础

七嘴八舌的讨论:项目的目的是什么?目标、问题梳理!先搞定人、再搞定事搞定人:结构化倾听=接受事实+理解情绪+理解期待行为搞定事:谁提的问题 问题是什么 问题的优先级 需要的资源逻辑思辨能力——短期需求&长期需求、过渡方案常见错误前提假设:只能做一个吗?偷换概念如何融入新环境,Top3问题,比如,中心最重要的三个项目是什么?...

2021-01-14 12:16:47 97

原创 机器学习——无监督学习

《统计学习方法》基本思想方向:聚类、降维、话题分析、图分析。硬聚类:一个样本只能属于一个类,比如聚类算法 软聚类:一个样本可以属于多个类,比如条件概率分布模型概率模型估计假设训练数据由一个概率模型生成,同时利用训练数据学习概率模型的结构和参数。概率模型包括混合模型、概率图模型(有向、无向)。无监督学习的三要素模型、策略、算法。模型函数、条件概率分布。聚类——类别降维——低维向量概率模型估计——混合概率模型有向或无向概率图模型。策略...

2020-12-27 17:41:02 89

原创 通用技能——职场能力建设

推荐职场公众号https://www.zhihu.com/people/ke-pu-zi-xun-70那些真正厉害的员工,都懂得向上管理!https://zhuanlan.zhihu.com/p/337674580?utm_source=wechat_session&utm_medium=social&utm_oi=62530029037997670401 能证明你价值的人,都是值得被管理的对象关于向上管理的解释中,最为人接受的莫过于彼得·德鲁克的这句话:“任..

2020-12-20 12:49:50 280 2

原创 深度学习——常见问题

数据太少怎么搞深度学习?https://mp.weixin.qq.com/s/wn5XYtEguhXAasVx8M37pw在我们讨论利用有限的数据进行深度学习的方法之前,请忘了神经网络并创建一个简单的基准。尝试一些传统模型(如随机森林)通常不需要很长时间。这将帮助你评估深度学习的任何潜在提升,并深入理解在你的问题上深度学习与其它传统方法的权衡取舍。获取更多数据花时间和金钱来收集更多数据。实际上,这通常是你的最佳选择。不确定需要收集多少数据?尝试在增加数据时绘制学习曲线并查看模型性能.

2020-12-20 12:22:42 879 1

原创 工程开发-DVC数据版本管理

数据版本管理DVC,data version controlhttps://zhuanlan.zhihu.com/p/112343018DVChttps://dvc.org/MLflowhttps://mlflow.org/datanamihttps://www.datanami.com/sacredhttps://github.com/IDSIA/sacred

2020-12-10 21:26:35 555

原创 数据不平衡问题

分类机器学习中,某一标签占比太大(标签稀疏),如何学习?https://www.zhihu.com/question/372186043/answer/1501948720?utm_source=wechat_session&utm_medium=social&utm_oi=625300290379976704

2020-12-09 09:47:22 2292

原创 机器学习——自动化机器学习

Automated Machine Learning

2020-11-10 09:30:27 151

原创 机器学习面经

【机器学习基础】9 大主题!机器学习算法理论面试题大汇总https://mp.weixin.qq.com/s/1AOTv_bsQhPg3qEZpF6vxQ

2020-11-02 22:49:41 185

原创 机器学习——大数据平台/分布式机器学习框架

基于实时计算Flink的机器学习算法平台及场景介绍https://zhuanlan.zhihu.com/p/212316218?utm_source=wechat_session&utm_medium=social&utm_oi=625300290379976704

2020-11-02 22:48:53 345

原创 深度学习——深度神经网络结构

作者:FJODOR VAN VEEN参与:吴攀、李亚洲转载链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650719170&idx=1&sn=68b6b7f87677f5287b6e5a306409653b&chksm=871b07bcb06c8eaa0a649d7d3fd7963423dd4ea51b6e7711bc63653a528fbf196566345ae064&scene=4#

2020-11-02 22:41:39 2223 1

原创 理论知识——数理统计

一个易用、易部署的Python遗传算法库https://zhuanlan.zhihu.com/p/192488077?utm_source=wechat_session&utm_medium=social&utm_oi=625300290379976704最大似然估计(MLE)、最大后验概率估计(MAP),与贝叶斯估计https://blog.csdn.net/u011508640/article/details/72815981...

2020-11-02 21:18:39 252

原创 机器学习——LR与理论基础

Logistic回归https://baozoulin.gitbook.io/-stanford-machine-learning/week-3/luojihuigui另一种更经典的解释损失函数什么是损失函数?参考链接:https://cloud.tencent.com/developer/article/1165263、https://zhuanlan.zhihu.com/p/58883095损失函数(loss function)是用来估量模型的预测值...

2020-11-02 21:18:01 262

原创 深度学习——batch normalization

参考链接:https://mp.weixin.qq.com/s/XPsRC6rC4_I9a-WPzOTSywTable of Contents什么是Batch Normalization它如何工作优点Batch Normalization的诅咒在使用小batch size的时候不稳定导致训练时间的增加什么是Batch Normalization在训练过程中,当我们更新之前的权值时,每个中间激活层的输出分布会在每次迭代时发生变化。这种现象称为内部协变量移位(IC..

2020-11-02 13:42:16 663

原创 深度学习——图神经网络

AI Lab】深度解析前沿方向:图深度学习的历史、最新进展和应用http://km.oa.com/group/33042/articles/show/439580?kmref=search&from_page=1&no=4

2020-11-01 23:21:42 135

原创 工程开发——web网络爬虫

python uget 自动爬虫selenium高级库的使用you-get# 金融数据(根据XPATH),一般情况用class name区分,复杂情况用xpath

2020-11-01 17:19:18 65

原创 GO 编程语言

Go语言学习点 gomod搭建开发环境 基础语法要熟悉 gin框架与公司的trpc-go框架 https://iwiki.woa.com/display/tRPC/tRPC-Go快速开始在真正开始之前,首先需要掌握基本理论知识,包括但不限于:Go语言基础,所有一切的基石,务必遵循tRPC-Go研发规范。 context原理,必须提前了解,特别是对超时控制的理解会很有帮助。 rpc概念,调用远程服务接口就像调用本地函数一样,能让你更容易创建分布式应用...

2020-10-09 17:21:36 942 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除