- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 机器学习实战——特征工程之特征构建
特征构建是指通过研究原始数据样本,结合机器学习实战经验和相关领域的专业知识,思考问题的潜在形式和数据结构,人工创造出新的特征,而这些特征对于模型训练又是有益的并且具有一定的工程意义。特征构建的方式主要有单列操作、多列操作、 分组/聚合操作这三种。1. 单列操作在pandas库中,主要利用map()函数进行单列的操作。map()函数是将目标函数作用于一个Series的每一个元素,而D...
2018-09-26 18:57:39 8011 1
原创 机器学习实战——特征工程之数据预处理
机器学习实战的特征工程主要包含数据预处理、特征构建、特征选择三步,首先来介绍数据预处理。我选择python作为工具,并将主要用到pandas、numpy等数据工具库。加载库:import pandas as pdimport numpy as np1. 观察数据(1)查看数据的行数和列数print("TRAIN shape:",train.shape)(2)查看数据的...
2018-09-26 10:59:39 875 2
原创 机器学习中的F1-score
一、什么是F1-scoreF1分数(F1-score)是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛,常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数,最大为1,最小为0。此外还有F2分数和F0.5分数。F1分数认为召回率和精确率同等重要,F2分数认为召回率的重要程度是精确率的2倍,而F0.5分数认为召回率的重要程度是精确率的一半。计算公式为:G...
2018-09-13 11:38:28 245137 17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人