机器学习
文章平均质量分 76
远古小山
这个作者很懒,什么都没留下…
展开
-
机器学习总结 第一课
机器学习总结 第一课这篇文章不涉及很多代码的部分,主要是机器学习处理数据的一些基本概念和流程。写这篇blog的原因是对前一段时间的总结。前一段时间参加阿里天池的贵州交通大数据的比赛,使用了很多机器学习的方法和模型(xgboost 和lightgbm),但是当时只限于知道接口的使用和接口的作用,不了解原理或者知识点很凌乱。所以打算趁着十一的空闲时间把知识点梳理一下。原创 2017-10-02 21:21:35 · 666 阅读 · 0 评论 -
pandas数据处理(一)
pandas数据处理(一)原创 2017-10-03 17:30:58 · 781 阅读 · 0 评论 -
xgboost 保存模型和特征重要度
1. 保存模型:(1)保存:bst.save_model('0001.model')(2)加载模型:bst_new = xgb.Booster({'nthread':4}) #init modelbst_new.load_model("0001.model") # load datasource from:http://blog.csdn.net/zc0205原创 2017-10-16 21:44:11 · 14744 阅读 · 0 评论 -
熵、KL散度
介绍熵、KL散度等。一、熵(entropy)根据shannon的信息论,给定一个字符集的概率分布,我们可以设计一种编码,使得表示该字符集组成的字符串平均需要的比特数最少。假设这个字符集是X,对x∈X,其出现概率为P(x),每个字符x需要的编码长度为log那么其最优编码平均需要的比特数等于这个字符集的熵$\log_2x$,...原创 2018-05-24 19:09:43 · 566 阅读 · 0 评论