GW190-CSDN博客

原创基于fasttext的新客服文本分类

基于fasttext的新客服文本分类

2022-11-26 11:38:50 843 2

目录：入门快速探索安装理论术语TRANSFORMERS 应用任务总结模型总结处理数据微调训练过的模型模型共享和上传tokenizers总结多语种模型高阶指南训练模型案例排除故障用自定义数据集进行微调transformer notebooks亚马逊云端跑模型社区Converting Tensorflow Checkpoints（未理解）先前包的迁移How to contribute to transformers?如何为transformers添加

2021-06-11 17:27:29 781

原创深入理解LightGBM学习笔记

学习笔记学习资料：https://zhuanlan.zhihu.com/p/99069186思考题：LightGBM和XGboost 的联系和区别？GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型，主要思想是利用弱分类器（决策树）迭代训练以得到最优模型，该模型具有训练效果好、不易过拟合等优点。联系：LightGBM和XGBoost 都是实现 GBDT算法的框架；区别：LightGBM提出的主要原因就是为了解决GBDT在海量数据遇到的问题

2021-05-26 17:30:00 310

原创 Task01 异常检测概论

Task01概述1、异常检测概念异常检测(Outlier Detection)：顾名思义，是识别与正常数据不同的数据，与预期行为差异大的数据异常类别：点异常、条件异常、群体异常异常检测应用场景：故障检测、医疗日常检测、网络入侵检测、欺诈检测、工业异常检测、时间序列异常检测、视频异常检测、日志异常检测检测的难点：负样本（异常样本）数据量少噪音影响，异常和噪音有时难分清2、异常检测方法2.1 基础方法2.1.1 基于统计学的方法学习一个拟合给定数据集的生成模型，然后识别出该模型低概率

2021-05-10 14:13:30 126

原创假设检验(hypothesis testing)

假设检验(hypothesis testing)假设检验：显著性检验是假设检验中最常用的一种方法，常用的假设检验方法有Z检验、t检验、卡方检验、F检验等。假设检验的两类错误：1、当假设H0正确时，小概率事件发生，我们拒绝原假设，因而犯“弃真”的错误，称此为第一类错误，犯第一类错误的概率恰好就是小概率事件发生的概率a2、当假设H0错误是，但一次抽样检测未发现不合理结果时，这时我们接受原假设，因而犯了“取伪”错误，记b，为第二类错误Z检验：...

2020-10-10 10:47:00 733

原创阿里妈妈广告商品点击数据分析

阿里妈妈广告商品点击数据分析报告一、分析背景与目的数据源：[https://tianchi.aliyun.com/dataset/dataDetail?dataId=56]阿里妈妈势头发展迅猛，营销仍存在部分盲点；这是阿里妈妈的一份关于广告曝光次数和点击率的数据，我们希望通过分析，发现数据隐藏的增长点，为运营侧提供策略建议；评价广告的一个关键指标是广告点击数，点击数反应该广告对大众的吸引力，只有发生点击行为，才会有后边我们希望的购买行为；点击次数 = 广告的曝光次数*点击率广告的曝光次数无法干

2020-09-21 14:45:45 2862 1

siweigao的博客

原创基于fasttext的新客服文本分类

翻译 Transformers翻译

原创深入理解LightGBM学习笔记

原创 Task01 异常检测概论

原创假设检验(hypothesis testing)

原创阿里妈妈广告商品点击数据分析

空空如也

空空如也

原创 基于fasttext的新客服文本分类

翻译 Transformers翻译

原创 深入理解LightGBM学习笔记

原创 Task01 异常检测概论

原创 假设检验(hypothesis testing)

原创 阿里妈妈广告商品点击数据分析

空空如也

空空如也

原创基于fasttext的新客服文本分类

原创深入理解LightGBM学习笔记

原创假设检验(hypothesis testing)

原创阿里妈妈广告商品点击数据分析