![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
kaggle
文章平均质量分 81
Lycoris_Liu
这个作者很懒,什么都没留下…
展开
-
kaggle: Facebook V Predicting Check Ins
数据抽样 将数据分成块(chunk),便于最近邻计算 特征工程(430) k=2500,选取前100个候选地点 与坐标有关的特征 XGboost特征:(记录最近邻点的地点分布情况) 最近邻(10个):k=1,5,10,20,50,100,250,500,1000,2500; xy比例(7个):r=1, 2.5, 4, 5.5, 7, 12, 30 空间密度(10个...原创 2018-09-13 13:32:22 · 1932 阅读 · 0 评论 -
Python 预测基因变异是否具有相互冲突的临床分类问题
数据下载自Kaggle的Genetic Variant Classifications数据集,大小为(65188, 46),数据原始来源于ClinVar。 https://www.kaggle.com/kevinarvai/clinvar-conflicting 注:数据集中只提供了变体检测结果不同时的检测数据及结果。 ClinVar上有一些关于人类遗传变异的注释的公共资源。这些变异(...原创 2018-09-26 19:42:18 · 2073 阅读 · 1 评论