【机器学习】
莫小苝
初次开始玩博客,请各位大牛多关照!
展开
-
【机器学习】在工程上机器学习特征选择的方法
特征选择是特征工程中的重要问题(另一个重要的问题是特征提取),坊间常说:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程尤其是特征选择在机器学习中占有相当重要的地位。通常而言,特征选择是指选择获得相应模型和算法最好性能的特征集,工程上常用的方法有以下: 1. 计算每一个特征与响应变量的相关性:工程上常用的手段有计算皮尔逊系数和互信息系数,皮尔逊系数只能衡量线性转载 2016-09-06 21:23:08 · 6186 阅读 · 0 评论 -
【机器学习】CentOS 7 下安装word2vec报错
CentOS下安装python版的word2vec报如下错误 [root@localhost /]# pip install --upgrade gensim Collecting gensim Using cached gensim-2.0.0.tar.gz Complete output from command python setup.py egg_info: The原创 2017-04-24 19:18:52 · 856 阅读 · 0 评论 -
【机器学习】数据不平衡问题
机器学习中的数据不平衡问题原创 2017-10-15 21:43:49 · 3225 阅读 · 0 评论 -
【机器学习】机器学习中模型评估的方法
机器学习中模型评估的方法原创 2017-10-17 15:54:08 · 529 阅读 · 0 评论