机器学习笔记_Recitative的博客-CSDN博客

机器学习笔记

关注

文章平均质量分 92

学习机器学习过程中的笔记，欢迎感兴趣的人交流指正

关注数：文章数：19 文章阅读量：6199 文章收藏量：10

作者: Recitative

好好学习，热爱生活

展开

python单元测试入门

编写基本的单元测试来验证代码的行为。

原创 2024-07-04 11:52:05 · 510 阅读 · 0 评论
AI4Bio-首届世界科学智能大赛：生命科学赛道——生物学年龄评价与年龄相关疾病风险预测特征优化

确定NaN填充方法，比较几种不同的特征选择方法，测试MLP的效果，为进一步测试AutoEncoder做准备，记录模型融合的思路，便于之后查阅和实现

原创 2023-08-25 20:40:01 · 597 阅读 · 2 评论
科大讯飞用户新增预测挑战赛数据可视化、交叉验证与特征工程

对类别数据进行编码，编写交叉验证方法，并使用catboost进行初步的特征选择

原创 2023-08-23 20:15:23 · 402 阅读 · 0 评论
AI4Bio-首届世界科学智能大赛：生命科学赛道——生物学年龄评价与年龄相关疾病风险预测 baseline分析

分析baseline，讨论进一步优化的方向

原创 2023-08-22 17:20:59 · 447 阅读 · 0 评论
科大讯飞用户新增预测挑战赛配置环境与跑baseline

分析赛题背景、数据，并尝试跑通决策树baseline

原创 2023-08-16 15:19:47 · 208 阅读 · 0 评论
AI4Bio-首届世界科学智能大赛：生命科学赛道——生物学年龄评价与年龄相关疾病风险预测环境配置与baseline运行

配置DSW服务器，下载并解压数据，运行baseline并submit

原创 2023-08-15 14:17:53 · 514 阅读 · 0 评论
Clustering

讨论非监督学习中的聚类任务，实现kmeans算法，并使用该算法进行图片的压缩。

原创 2023-08-13 20:37:39 · 137 阅读 · 0 评论
Decision Tree

了解决策树，学习决策树的划分方式，并推导信息增益（Information Gain）；学习离散多项数据、连续数据和缺失值的处理；了解回归树，推导使用variance作为划分依据的回归方法；学习tree ensemble；了解tree boost并尝试使用XGBoost拟合模型。

原创 2023-08-04 12:16:36 · 67 阅读 · 1 评论
Make Decision

介绍如何从多个模型中选择合适的模型，bias和variance的概念，常用的baseline以及正则化对bias和variance的影响，并通过代码说明如何选择合适的神经网络罗模型

原创 2023-08-01 12:24:48 · 363 阅读 · 1 评论
Multi Class Classfication - Softmax

讨论了Multiclass分类问题，介绍了Softmax函数以及如何使用Softmax处理多分类问题，结合前一篇笔记说明了Softmax的loss函数。讨论TensorFlow中的from_logits属性，以及为什么应用该属性可以减少舍入误差，提高运算精度和速度。对比Multilabel问题，方式和Multiclass问题混淆。讨论使用Adam优化方法自动调整学习率的优势，并使用该方法训练模型。

原创 2023-07-20 18:46:54 · 205 阅读 · 0 评论
Training a Neural Network in TensorFlow & Back Propagation

使用TensorFlow实现简单的神经网络，给出熵和交叉熵定义，并据此推导损失函数。了解如何选择activation函数，常用的activation函数以及选择activation函数的重要性。通过案例详细推导反向传播（back propagation），介绍SymPy符号数学库，以及如何使用该库计算导数，推导计算图，利用计算图推导反向传播，并给出对应的链式表达。讨论了过拟合问题，局部最优和全局最优问题，以及一些常见的解决策略

原创 2023-07-20 18:38:32 · 243 阅读 · 0 评论
Inference with TensorFlow

使用tensorflow实现线性回归、对率回归和简单的神经网络；并讨论tensorflow的InputLayer与layer.build()方法

原创 2023-07-15 18:59:51 · 340 阅读 · 2 评论
Neural Networks & Forward Inference

介绍神经网络的基本概念，以及如何使用神经网络进行推断；通过使用NumPy自行实现神经网络的方式，深入神经网络的底层原理。

原创 2023-07-15 18:09:57 · 336 阅读 · 1 评论
Overfitting & Regularization

过拟合和欠拟合现象的产生，以及如何使用正则化方法解决过拟合现象

原创 2023-06-30 15:54:53 · 264 阅读 · 0 评论
Classification

实现logistic regression

原创 2023-06-27 10:00:44 · 106 阅读 · 1 评论
Multiple Linear Regression

多元线性回归的相关内容，以及广义上的线性回归模型

原创 2023-06-20 20:36:05 · 244 阅读 · 1 评论
Linear Regression using Scikit-Learn

使用sklearn实现线性回归，并设计多项式特征

原创 2023-06-24 20:30:28 · 328 阅读 · 2 评论
Linear Regression & Gradient Descent

使用梯度下降法实现一元线性回归，并讨论了线性回归闭式解的推导

原创 2023-06-19 15:49:32 · 802 阅读 · 0 评论
Supervised Learning & Unsupervised Learning

监督学习指的是学习input到output的映射关系（mapping），监督学习最主要的特征是会给出answers，即对每个input，给出唯一对应的output答案；并在学习后，通过给出没有output的input，猜测可能的output。

原创 2023-06-19 15:36:07 · 88 阅读 · 0 评论

机器学习笔记

作者: Recitative

python单元测试入门

AI4Bio-首届世界科学智能大赛：生命科学赛道——生物学年龄评价与年龄相关疾病风险预测 特征优化

科大讯飞 用户新增预测挑战赛 数据可视化、交叉验证与特征工程

AI4Bio-首届世界科学智能大赛：生命科学赛道——生物学年龄评价与年龄相关疾病风险预测 baseline分析

科大讯飞 用户新增预测挑战赛 配置环境与跑baseline

AI4Bio-首届世界科学智能大赛：生命科学赛道——生物学年龄评价与年龄相关疾病风险预测 环境配置与baseline运行

Clustering

Decision Tree

Make Decision

Multi Class Classfication - Softmax

Training a Neural Network in TensorFlow & Back Propagation

Inference with TensorFlow

Neural Networks & Forward Inference

Overfitting & Regularization

Classification

Multiple Linear Regression

Linear Regression using Scikit-Learn

Linear Regression & Gradient Descent

Supervised Learning & Unsupervised Learning

AI4Bio-首届世界科学智能大赛：生命科学赛道——生物学年龄评价与年龄相关疾病风险预测特征优化

科大讯飞用户新增预测挑战赛数据可视化、交叉验证与特征工程

科大讯飞用户新增预测挑战赛配置环境与跑baseline

AI4Bio-首届世界科学智能大赛：生命科学赛道——生物学年龄评价与年龄相关疾病风险预测环境配置与baseline运行