- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 LightGBM和XGboost的对比
2017年初,微软开源了新的机器学习框架LightGBM,以GBDT为基础,据说在Higgs数据集上LightGBM比XGBoost快将近10倍,内存占用率大约为XGBoost的1/6 中文文档:http://lightgbm.apachecn.org/cn/latest/index.html XGBoost是此前最好的Boosting模型,既然传言LightGBM性能更高,那二者有什么不同呢...
2018-03-25 12:47:24 2451
原创 读书笔记-集体智慧编程
不定时更新 2018.3.26一、推荐相关性评价方法:欧氏距离、皮尔逊评价对于稀疏数据集,基于物品的过滤要优于基于用户的过滤二、聚类tanimoto系数可用来评价两组只包含0、1数据的距离,它代表交集和并集的比率三、搜索与排名爬取网页(urllib2)- 连接数据库(pysqlite2)- 建立索引数据表-网页源码分词 - 利用单词建立索引 - 利用单词频度、文档位置、单词距离进行排名使用page...
2018-03-04 16:57:23 288
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人