机器学习笔记
文章平均质量分 92
学习机器学习过程中的笔记,欢迎感兴趣的人交流指正
Recitative
好好学习,热爱生活
展开
-
python单元测试入门
编写基本的单元测试来验证代码的行为。原创 2024-07-04 11:52:05 · 510 阅读 · 0 评论 -
AI4Bio-首届世界科学智能大赛:生命科学赛道——生物学年龄评价与年龄相关疾病风险预测 特征优化
确定NaN填充方法,比较几种不同的特征选择方法,测试MLP的效果,为进一步测试AutoEncoder做准备,记录模型融合的思路,便于之后查阅和实现原创 2023-08-25 20:40:01 · 597 阅读 · 2 评论 -
科大讯飞 用户新增预测挑战赛 数据可视化、交叉验证与特征工程
对类别数据进行编码,编写交叉验证方法,并使用catboost进行初步的特征选择原创 2023-08-23 20:15:23 · 402 阅读 · 0 评论 -
AI4Bio-首届世界科学智能大赛:生命科学赛道——生物学年龄评价与年龄相关疾病风险预测 baseline分析
分析baseline,讨论进一步优化的方向原创 2023-08-22 17:20:59 · 447 阅读 · 0 评论 -
科大讯飞 用户新增预测挑战赛 配置环境与跑baseline
分析赛题背景、数据,并尝试跑通决策树baseline原创 2023-08-16 15:19:47 · 208 阅读 · 0 评论 -
AI4Bio-首届世界科学智能大赛:生命科学赛道——生物学年龄评价与年龄相关疾病风险预测 环境配置与baseline运行
配置DSW服务器,下载并解压数据,运行baseline并submit原创 2023-08-15 14:17:53 · 514 阅读 · 0 评论 -
Clustering
讨论非监督学习中的聚类任务,实现kmeans算法,并使用该算法进行图片的压缩。原创 2023-08-13 20:37:39 · 137 阅读 · 0 评论 -
Decision Tree
了解决策树,学习决策树的划分方式,并推导信息增益(Information Gain);学习离散多项数据、连续数据和缺失值的处理;了解回归树,推导使用variance作为划分依据的回归方法;学习tree ensemble;了解tree boost并尝试使用XGBoost拟合模型。原创 2023-08-04 12:16:36 · 67 阅读 · 1 评论 -
Make Decision
介绍如何从多个模型中选择合适的模型,bias和variance的概念,常用的baseline以及正则化对bias和variance的影响,并通过代码说明如何选择合适的神经网络罗模型原创 2023-08-01 12:24:48 · 363 阅读 · 1 评论 -
Multi Class Classfication - Softmax
讨论了Multiclass分类问题,介绍了Softmax函数以及如何使用Softmax处理多分类问题,结合前一篇笔记说明了Softmax的loss函数。讨论TensorFlow中的from_logits属性,以及为什么应用该属性可以减少舍入误差,提高运算精度和速度。对比Multilabel问题,方式和Multiclass问题混淆。讨论使用Adam优化方法自动调整学习率的优势,并使用该方法训练模型。原创 2023-07-20 18:46:54 · 205 阅读 · 0 评论 -
Training a Neural Network in TensorFlow & Back Propagation
使用TensorFlow实现简单的神经网络,给出熵和交叉熵定义,并据此推导损失函数。了解如何选择activation函数,常用的activation函数以及选择activation函数的重要性。通过案例详细推导反向传播(back propagation),介绍SymPy符号数学库,以及如何使用该库计算导数,推导计算图,利用计算图推导反向传播,并给出对应的链式表达。讨论了过拟合问题,局部最优和全局最优问题,以及一些常见的解决策略原创 2023-07-20 18:38:32 · 243 阅读 · 0 评论 -
Inference with TensorFlow
使用tensorflow实现线性回归、对率回归和简单的神经网络;并讨论tensorflow的InputLayer与layer.build()方法原创 2023-07-15 18:59:51 · 340 阅读 · 2 评论 -
Neural Networks & Forward Inference
介绍神经网络的基本概念,以及如何使用神经网络进行推断;通过使用NumPy自行实现神经网络的方式,深入神经网络的底层原理。原创 2023-07-15 18:09:57 · 336 阅读 · 1 评论 -
Overfitting & Regularization
过拟合和欠拟合现象的产生,以及如何使用正则化方法解决过拟合现象原创 2023-06-30 15:54:53 · 264 阅读 · 0 评论 -
Classification
实现logistic regression原创 2023-06-27 10:00:44 · 106 阅读 · 1 评论 -
Multiple Linear Regression
多元线性回归的相关内容,以及广义上的线性回归模型原创 2023-06-20 20:36:05 · 244 阅读 · 1 评论 -
Linear Regression using Scikit-Learn
使用sklearn实现线性回归,并设计多项式特征原创 2023-06-24 20:30:28 · 328 阅读 · 2 评论 -
Linear Regression & Gradient Descent
使用梯度下降法实现一元线性回归,并讨论了线性回归闭式解的推导原创 2023-06-19 15:49:32 · 802 阅读 · 0 评论 -
Supervised Learning & Unsupervised Learning
监督学习指的是学习input到output的映射关系(mapping),监督学习最主要的特征是会给出answers,即对每个input,给出唯一对应的output答案;并在学习后,通过给出没有output的input,猜测可能的output。原创 2023-06-19 15:36:07 · 88 阅读 · 0 评论