- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 DataCastle微额借款用户人品预测大赛冠军思路
微额借款用户人品预测的数据不仅有带标签数据,而且还有大量无标签数据,数据存在缺失值,类别不平衡,特征高维度等特点。本次大赛主要是为了能从用户行为数据分析‘小额微贷’申请借款用户的信用状况,来判断其是否逾期。针对需要解决的问题和数据特征,我们主要从四个方面进行处理:数据预处理,特征工程,数据不平衡,以及半监督模型训练。首先,由于数据中存在大量的缺失值,因此需要对缺失值数据进行预处理。比赛中,我们视缺失值为一种特征进行处理。统计了每个样本的缺失值个数,并进行排序,发现样本类别和缺失值个数呈规律性阶梯状关系。通
2016-03-25 10:42:37 18672 12
原创 JAVA计算稀疏矩阵余弦相似度
import java.util.HashMap;import com.aliyun.odps.udf.UDF;/*** * BASE UDF */public final class MyUDF extends UDF { /** * UDF Evaluate接口 * * UDF在记录层面上是一对一,字段上是一对
2016-03-22 23:03:46 3189
原创 windows安装python和xgboost
(建议先装anacoda自带了很多包)1.下载releaseshttps://github.com/dmlc/xgboost/releases2.解压后用vs编译,打开windows文件里的sln,选择releases,X64,生成。如果是 全部重新生成: 成功 3 个,失败 0 个
2016-03-21 21:25:47 2713
原创 单源点最短路径Dijkstra的java实现
public class Dijkstra { public static void main(String[] args) { } public static int[] dijkstra(int[][] weight, int start) { // 接受一个有向图的权重矩阵,和一个起点编号start(从0编号,顶点存在数组中) // 返回一个int[] 数组,表示从s
2016-03-10 13:40:19 2303 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人