自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 基于fasttext的新客服文本分类

基于fasttext的新客服文本分类

2022-11-26 11:38:50 816 2

翻译 Transformers翻译

目录:入门快速探索安装理论术语TRANSFORMERS 应用任务总结模型总结处理数据微调训练过的模型模型共享和上传tokenizers总结多语种模型高阶指南训练模型案例排除故障用自定义数据集进行微调transformer notebooks亚马逊云端跑模型社区Converting Tensorflow Checkpoints(未理解)先前包的迁移How to contribute to transformers?如何为transformers添加

2021-06-11 17:27:29 734

原创 深入理解LightGBM学习笔记

学习笔记学习资料:https://zhuanlan.zhihu.com/p/99069186思考题:LightGBM和XGboost 的联系和区别?GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。联系:LightGBM和XGBoost 都是实现 GBDT算法的框架;区别:LightGBM提出的主要原因就是为了解决GBDT在海量数据遇到的问题

2021-05-26 17:30:00 292

原创 Task01 异常检测概论

Task01概述1、异常检测概念异常检测(Outlier Detection):顾名思义,是识别与正常数据不同的数据,与预期行为差异大的数据异常类别:点异常、条件异常、群体异常异常检测应用场景:故障检测、医疗日常检测、网络入侵检测、欺诈检测、工业异常检测、时间序列异常检测、视频异常检测、日志异常检测检测的难点:负样本(异常样本)数据量少噪音影响,异常和噪音有时难分清2、异常检测方法2.1 基础方法2.1.1 基于统计学的方法学习一个拟合给定数据集的生成模型,然后识别出该模型低概率

2021-05-10 14:13:30 109

原创 假设检验(hypothesis testing)

假设检验(hypothesis testing)假设检验:显著性检验是假设检验中最常用的一种方法,常用的假设检验方法有Z检验、t检验、卡方检验、F检验等 。假设检验的两类错误:1、当假设H0正确时,小概率事件发生,我们拒绝原假设,因而犯“弃真”的错误,称此为第一类错误,犯第一类错误的概率恰好就是小概率事件发生的概率a2、当假设H0错误是,但一次抽样检测未发现不合理结果时,这时我们接受原假设,因而犯了“取伪”错误,记b,为第二类错误Z检验:...

2020-10-10 10:47:00 710

原创 阿里妈妈广告商品点击数据分析

阿里妈妈广告商品点击数据分析报告一、分析背景与目的数据源:[https://tianchi.aliyun.com/dataset/dataDetail?dataId=56]阿里妈妈势头发展迅猛,营销仍存在部分盲点;这是阿里妈妈的一份关于广告曝光次数和点击率的数据,我们希望通过分析,发现数据隐藏的增长点,为运营侧提供策略建议;评价广告的一个关键指标是广告点击数,点击数反应该广告对大众的吸引力,只有发生点击行为,才会有后边我们希望的购买行为;点击次数 = 广告的曝光次数*点击率广告的曝光次数无法干

2020-09-21 14:45:45 2761 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除