实用机器学习
文章平均质量分 91
前行follow
learning sharing and discussing.
展开
-
第六章——模型融合
6 模型融合6.1 偏差和方差分布图公式推导:假设从y=f(x)+ϵy = f(x) + \epsilony=f(x)+ϵ采样得到D={(x1,y1),...,(xn,yn)}D = \{(x_1,y_1),...,(x_n,y_n)\}D={(x1,y1),...,(xn,yn)},ϵ表示噪音\epsilon表示噪音ϵ表示噪音在D上最小化MSE,得到f^\hat{f}f^。希望在不同的DDD上都能生成一个好的f^\hat{f}f^公式:因为f是一个真实的东西原创 2021-12-05 18:00:00 · 168 阅读 · 0 评论 -
实用机器学习——第四、五章
4 ML模型回顾4.1 机器学习介绍算法类型监督学习在打标签后的数据上训练,去预测标签自监督学习(标号来自于数据本身)E.g. word2vec BERT半监督学习同时在标注和未标注上的数据上训练,通过已标注的数据去预测未标注数据 E.g. 自训练无监督学习在无标签数据训练 E.g. 分簇、分布估计(GAN)强化学习和环境交互,采取行动去获取奖励监督学习训练模型通过输入获取输出损失函数衡量预测值和真实值的不同目标例如:最小化原创 2021-11-22 19:00:00 · 500 阅读 · 0 评论 -
实用机器学习——第三章笔记
3. 数据预处理3.1 数据探索性分析(EDA)/home/yxx/notebook/Deep_learning/PracticeMachineLearning/DataPreprocessing/EDA.ipynb3.2 数据清理流程图数据错误数据通常有错误数据丢失,错误值,极端值好的ML模型对错误有弹性线上部署的模型可能影响新收集数据的质量(由于模型预测结果不准确)数据错误的种类outliers:数据分布偏移Rule violations :违背规则的P原创 2021-11-18 15:11:47 · 538 阅读 · 0 评论 -
实用机器学习——第一、二章
1. 课程介绍机器学习流程2. 数据收集2.1 数据获取数据获取的流数据是否可用找存在的数据集(科研场景)找benchmark数据集衡量新的方法(科研和应用场景)例如:对于超参数的微调算法为准备的不同的中小规模数据集例如:对于特别大的深层神经网络而准备的大规模数据集收集新数据(应用)例如:不同景的视频ML数据集MNISTImageNetAudioSet: Youtube声音的切片Kinetics: Youtube视频的切片KITTI:无人驾驶的原创 2021-11-17 17:10:19 · 370 阅读 · 0 评论