![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
leidashuaige
这个作者很懒,什么都没留下…
展开
-
特征工程
特征工程More data beats clever algorithms, but better data beats more data.类型特征特点很多种类的话,数值会变得很稀疏很难填空值One Hot编码可以被大多数线性算法使用稀疏格式对于内存友好大多数处理方法不能友好的对待缺失值以及新类别哈希编码例子如果发生碰撞姐,就使用不同编码的值CONCAT...转载 2019-10-17 17:33:47 · 167 阅读 · 0 评论 -
华为softcomm人工智能比赛记录
参赛简介参赛形式治理分析编写算法代码训练后提交模型结果参与在线排名,取前6名进入决赛决赛路演要求:介绍PPT+算法模型代码+模型训练演示(知识产权归开发者所有)介绍PPT要求:开发团队及单位介绍,成员介绍(必选)算法建模、特征工程解题思路介绍(必选)使用了华为的哪些云服务API等资产(必选)时间安排8月15号决赛!8月27号 松山湖路演9月18号颁奖赛题...原创 2019-08-20 12:04:17 · 256 阅读 · 0 评论 -
Coursera, How to win a competition 课程笔记
How to win a data science competition课程简介课程收获how to preprocess the dataextract featureshow to set up the validation correctlyoptimize the given metricA truly unique opportunity to see the deta...原创 2019-08-20 12:08:30 · 923 阅读 · 0 评论 -
如何参加人工智能比赛用的时间更少,结果更好?
收集比赛咨询,对于比赛任何一点的不理解都去找工作人员问清楚官网上的细节参与比赛的社群还有工作人员建立好模型优化的技术栈分析数据无用的特征相同的特征归一化特征建立于test set一致的测试方法TSNE观察数据PCA观察数据Kfold拆分数据!!需要总结添加特征观察数据的意义通用添加特征方法feature自己的最大最小,标准差,方差featu...原创 2019-08-20 12:10:36 · 184 阅读 · 0 评论 -
决策树
视频连接https://www.youtube.com/watch?v=7VeUPuFGJHk树的基本结构问一个问题,然后根据回答来判断结果树的完整结构描述顶层浅蓝色为root node蓝色为internal node绿色为 leaf node注意点root node的问题很重要问题可以被重复结果可能被重复如何构造一个树选择根节点使用每一个feature对...原创 2019-09-05 16:32:44 · 167 阅读 · 0 评论 -
Random Forests 随机森林
https://www.youtube.com/watch?v=nyxTdL_4Q-QStep 1Bootstrapping 抽选数据集或自助抽样法是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。Step 2每次构建单个的时候树 / root node / internal node的时候只使用 变量 或者 column的子集...原创 2019-09-05 18:00:48 · 293 阅读 · 0 评论 -
Xgboost
Xgboost原理多模型融合,下一个模型总是预测上一个模型的残差。Xgboost是一种思想,理论上可以用任何一种模型做XGboost求导Xgboost比喻成泰勒展开式泰勒展开式使用多阶的逼近函数。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NVdzM6To-1570786404995)最后几个模型一起求导得到结果。...原创 2019-10-11 17:34:39 · 89 阅读 · 0 评论