自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 集成学习|基于scikit-learn的机器学习基础

集成学习|机器学习基础机器学习项目的基本流程1. 明确项目任务2. 收集数据与选择特征3. 选择度量性能的指标4. 选择具体的模型并进行训练以优化模型常见的回归模型5. 评估模型的性能并调参 基于scikit-learn库对机器学习的基本模型进行学习 机器学习项目的基本流程 1. 明确项目任务 常见的任务有:回归、分类与无监督学习 回归:通过特征预测连续性因变量 分类:通过特征预测离散型因变量 无监督学习:自主寻找特征间的关系 2. 收集数据与选择特征 scikit-learn库中自带的数据集

2021-03-19 01:56:10 285

原创 组队学习|DCIC2021-算法分析题-baseline改进

组队学习|DCIC2021-算法分析题-baseline改进 改进结果: 原baseline的缺点 评价潮汐程度时以停车点为标准,而赛题要求为识别出潮汐现象最突出的40个区域,可能会存在单个停车点潮汐情况突出但其所在区域不突出的情况,造成误差 kNN最近邻计算时使用停车点的中心经纬度来进行计算,受到停车点面积大小的影响(面积较大的停车点可能据中心点距离更大),故用停车点的边界经纬度计算会更为准确 hnsw近似搜索存在误差 改进方法 这里我利用baseline中提及的geohash编码的方法来对base

2021-02-24 22:38:20 258

原创 组队学习|DCIC2021算法分析题学习分享

组队学习|DCIC2021算法分析题学习分享赛题分析思路难点数据预处理停车点处理方法一:基于geohash的停车点匹配潮汐点计算原理实现过程方法二:基于距离匹配计算潮汐点Nearestneighbors & hnsw近似搜索实现过程 本次主要针对学习baseline过程中未曾想到的方法与代码技巧进行分享 赛题分析 思路 通过共享单车订单数据与共享单车停车点数据进行匹配,可以获得不同时间共享单车在何处打开与关闭的数据。针对二者计算差值可以获得不同停车点的潮汐值,对比停车点的面积可以获得潮汐密度。 难

2021-02-19 22:21:21 227

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除