机器学习
Miss顺
这个作者很懒,什么都没留下…
展开
-
准确率/召回率/精准率/F值_模型评价
模型训练及测试模型选择:对特定任务最优建模方法的选择或者对特定模型最佳参数的选择。在训练数据集上运行模型(算法)并在测试数据集中测试效果,迭代进行数据模型的修改, 这种方式被称为 **交叉验证**(将数据分为**训练集**和**测试集**,使用训练集构建模型,并使用测 试集评估模型提供修改建议) 模型的选择会尽可能多的选择算法进行执行,并比较执行结果 模型的测试一般以下几个方面来进行比较,分别是准确率/召回率/精准率/F值准确率(Accuracy)=提取出的正确样本数/总样本数召回率(Rec原创 2020-07-03 11:05:06 · 2073 阅读 · 0 评论 -
数据清洗和转换
数据清洗和转换实际生产环境中机器学习比较耗时的一部分大部分的机器学习模型所处理的都是特征,特征通常是输入变量所对应的可用于模型的 数值表示大部分情况下 ,收集得到的数据需要经过预处理后才能够为算法所使用,预处理的操作 主要包括以下几个部分:数据过滤处理数据缺失处理可能的异常、错误或者异常值合并多个数据源数据数据汇总对数据进行初步的预处理,需要将其转换为一种适合机器学习模型的表示形式, 对许多模型类型来说,这种表示就是包含数值数据的向量或者矩阵将类别数据编码成为对应的数值表示(一般原创 2020-06-30 18:33:44 · 3750 阅读 · 1 评论 -
机器学习公开数据集
机器学习可用公开数据集网址在实际工作中,我们可以使用业务数据进行机器学习开发,但是在学习过程中, 没有业务数据,此时可以使用公开的数据集进行开发,常用数据集如下:http://archive.ics.uci.edu/ml/datasets.htmlhttps://aws.amazon.com/cn/public-datasets/https://www.kaggle.com/competitionshttp://www.kdnuggets.com/datasets/index.htmlhttp:原创 2020-06-30 15:44:00 · 369 阅读 · 0 评论 -
Choosing the right estimator
选择合适的估计器 不同的估算器更适合于不同类型的数据和不同问题。 下面的流程图旨在为用户提供一些粗略的指导,指导他们如何处理有关哪些估算器尝试使用数据的问题。http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html此笔记仅作为复习知识。...原创 2020-06-30 15:05:43 · 99 阅读 · 0 评论