实用机器学习-李沐
文章平均质量分 90
留小星
持续更新 CV、NLP、语音、地震学领域深度学习相关阅读和学习笔记、手动实现各类深度学习网络结构(CNN、Transformer、GAN、DDPM、LLM)
展开
-
实用机器学习笔记(九):模型评估+过/欠拟合+模型验证
文章目录Evaluation Metrics1. Model Metrics2. Metrics for Classification3. AUC & ROCunderfiting & overfiting1. Training and generalization errors2. Model complexity3. Data complexityModel Validation1. Estimate Generalization Error2. Hold out validation3原创 2022-03-23 17:46:46 · 1621 阅读 · 0 评论 -
实用机器学习笔记(八):SGD + MLP + CNN + RNN简介
文章目录1. Mini-batch stochastic gradient descnet (SGD)2. Linear Methods -> Multilayer Perception(MLP)3. Dense Layer --> Convolution layerThe problem of dense layerConvolution layerPooling LayerConvolution Neural Network(CNN): 有参考文献,可以白嫖4. Dense layer --原创 2022-03-22 22:52:28 · 1849 阅读 · 0 评论 -
实用机器学习笔记(七):决策树
文章目录1. Decision Trees (决策树)2. Random Forest (随机森林)3. Gradient Boosting Decision Trees(梯度提升决策树)4. Summary1. Decision Trees (决策树)优点Explainable (可解释性)Can handle both numerical and categorical features (数值与分类特征)缺点Very non-robust(unsemble to help) (鲁棒性原创 2022-03-13 10:25:33 · 1778 阅读 · 0 评论 -
实用机器学习笔记(六):特征工程
文章目录1. Feature Engineering(特征工程)2. Tabular data features(表格数据)3. Text features (文本数据)4. image/video features (图片/视频数据)5. Summary1. Feature Engineering(特征工程)Machine learning algorithms prefer well define fixed length input/output (机器学习更喜欢固定的输入输出)Feat原创 2022-03-13 10:14:20 · 1284 阅读 · 0 评论 -
实用机器学习笔记(五):数据变换
文章目录Data Transformation1. Normalization for Real Value Columns2. Image Transformations3. Video Transformations4. Text transformations5. SummaryData TransformationData are transformed into forms appropriate for ML algorithmsWe focus on methods in a part原创 2022-03-11 17:53:34 · 706 阅读 · 0 评论 -
实用机器学习笔记(四):数据清洗
文章目录Data Clearning1. Data Errors2. Types of data errors3. Outlier Detection4. Rule based detection5. Pattern-based detectionData Clearning1. Data ErrorsData often have errors -the mismatch with ground truth(数据误差)Good ML model are resilient to the erro原创 2022-03-11 17:48:21 · 965 阅读 · 0 评论 -
实用机器学习笔记(三):数据预处理
文章目录一、使用pandas+seaborn+pyplot进行数据展示和预处理操作1. 读取与查看数据2. 数据预处理: Drop + Filter + Replace3. 数据统计4. 数据可视化二、总结一、使用pandas+seaborn+pyplot进行数据展示和预处理操作Pandas基础教学:这是前两天在Datawhale看到的一篇关于Pandas的介绍,写得非常好,记录备用https://mp.weixin.qq.com/s/A232A6OLxrlsZUx0VGv3Ow1. 读取与原创 2022-03-11 16:32:21 · 2648 阅读 · 0 评论 -
实用机器学习笔记(二):数据标注
文章目录数据标注1. 数据标注流程2. semi-supervised learning (SSL) : 半监督学习3. 数据标注的挑战数据标注1. 数据标注流程Have enough data? 数据是否充足improve label,data, or model? 标签、数据和模型哪个部分需要提升enough label? 标签是否充足semi-supervised learning 半监督学习enough budget ? 预算是否充足label via crowd s原创 2022-03-08 12:09:53 · 1002 阅读 · 0 评论 -
实用机器学习笔记(一):数据获取
文章目录一、课程介绍重点二、数据获取2.1 数据获取步骤2.2 常见ML数据集2.3 哪里去找数据集2.4 数据融合2.5 生成数据2.6 总结三、网页数据抓取3.1 网页抓取工具3.2 爬取规则一、课程介绍重点A ML workflow includes:formulating the problem (找问题)preparing data(准备数据)training and deploying ML model (训练网络)monitoring (持续跟踪)二、数据获取Flow原创 2022-03-08 11:53:10 · 511 阅读 · 0 评论