- 博客(9)
- 资源 (115)
- 收藏
- 关注
转载 DM13---结合Scikit-learn介绍几种常用的特征选择方法
原文地址:https://www.cnblogs.com/hhh5460/p/5186226.html作者:Edwin Jarvis特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之
2018-03-20 14:01:18 330
原创 DM12---xgboost学习
基本资料论文: https://arxiv.org/abs/1603.02754 原理博客: 《机器学习(四)— 从gbdt到xgboost》 https://www.cnblogs.com/mfryf/p/5946815.html 《GBDT&GBRT与XGBoost》 http://blog.csdn.net/u011826404/article/details/764...
2018-03-13 17:27:34 315
原创 DM11---数据可视化[图片数字]
基于TSNE可视化 例子01:import matplotlibimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as snsfrom sklearn.decomposition import PCAfrom sklearn.manifold import TSNEtrain_df = pd...
2018-03-12 22:23:22 575
原创 大数据学习[21]---java操作ES一例
一个常用的java操作ES的例子://GET info/_search//{// "query": {// "nested": {// "path": "keywords02",// "score_mode": "max",// "query": {// "function_score&
2018-03-12 21:09:48 2666
原创 DM10-偏差-方差-验证曲线-学习曲线
一直在匆忙学习各种模型,很少静下心来思考过,模型学习的一些方法根源于哪里;对于所提出的模型是否合适,参数是否合适。从而了验证的相关方法,验证模型:验证曲线与学习曲线 确定一个模型后,想验证哪个参数比较好,我们可以采用验证曲线去完成这个问题。 来自http://sklearn.apachecn.org/cn/0.19.0/modules/learning_curve.html的关于“偏差”与“方...
2018-03-12 20:59:43 915
原创 DM09---Cox-Box
1. 相关参考内容CoxBox论文G.E.P. Box and D.R. Cox, “An Analysis of Transformations”, Journal of the Royal Statistical Society B, 26, 211-252 (1964).scipy的CoxBoxhttps://docs.scipy.org/doc/scipy/refe...
2018-03-12 18:22:58 580
转载 DM08--不平衡数据分类算法介绍与比较
转自:http://blog.csdn.net/a358463121/article/details/52304670 原文:https://arxiv.org/pdf/1608.06048.pdf 介绍在数据挖掘中,经常会存在不平衡数据的分类问题,比如在异常监控预测中,由于异常就大...
2018-03-09 22:48:55 534
原创 NLP17-word2vec的一些想法
word2vec确是挺好用的。 关于原理网上比较多。 【1】大白话讲解word2vec到底在做些什么 http://blog.csdn.net/mylove0414/article/details/61616617 word2vec是一个最初级的入门白话讲述。作为一个感性认识的讲述。 【2】word2vec原理及实现 http://blog.csdn.net/FANGPINLEI/...
2018-03-07 21:01:19 456
原创 mysql--窗口-函数-储存过程-视图-事件-触发器的串
1. 窗口函数mysql好像没有发现窗口函数,然后…… 需求1:为数据表增加行号,row_number()的功能。SELECT t2.score, t2.op_time, -- 行号 @no := @no + 1 AS row_no FROM `student` t2, (SELECT @no := 0) tx ; 需求2:把第一个学习记录...
2018-03-01 22:09:26 582 1
fasttext.zip[windows]
2017-11-19
presto-cli-0.184-executable.jar
2017-09-24
apache-flume-1.7.0-bin.tar.gz
2017-09-23
apache-maven-3.3.9-bin.tar.gz
2017-09-16
hbase-1.3.1-src.tar.gz
2017-09-16
zookeeper-3.4.9.tar.gz
2017-09-15
tensorflow-0.12.1-cp35-cp35m-win_amd64
2017-02-22
zh_msra_onto4_mrc4ner.zip
2021-03-02
SemEval2010_task8_all_data
2020-05-25
en_core_web_sm
2020-05-25
sighan-bakeoff
2018-08-16
crf++_0.58[linux and win]
2018-01-14
Twisted系列教程等
2017-12-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人