Macine Learning
面向未来的历史
这个作者很懒,什么都没留下…
展开
-
特征选择--scikit-learn
特征选择(Feature Selection):choosing a subset of all the features(the ones more informative)。最终得到的特征选是原来特征的一个子集。特征选取是机器学习领域非常重要的一个方向。 主要有两个功能:(1)减少特征数量、降维,使模型泛化能力更强,减少过拟合(2)增强度特征和特征值之间的理解1,原创 2016-07-29 12:28:12 · 36410 阅读 · 2 评论 -
gensim中实践LDA
????from sklearn import datasetsnews_dataset=datasets.fetch_20newsgroups(subset="all",remove=("headers","footers","quotes"))documents=news_dataset.dataprint(documents[0])#"\n\nI am sure some bashers原创 2016-08-01 23:53:39 · 11465 阅读 · 1 评论 -
L0,L1,L2正则化--广义线性模型
L0范数表示向量中非零元素的个数 L1正则化表示各个参数绝对值之和。 L1正则化使得模型更加稀疏。L2正则化标识各个参数的平方的和的开方值。 L2使得模型参数更趋近于0,提高泛化能力。参考文章: L0,L1,L2正则化浅析 http://blog.csdn.net/vividonly/article/details/50723852怎么理解在模型中使用L1+L2正则化 https://原创 2016-07-31 01:06:36 · 2074 阅读 · 0 评论 -
spark&pthon MLlib逻辑回归
环境:mac osx python3.5 由于系统自带的python是2.7版本,所以需要进行配置修改。 1, 添加pyspark对应的python的系统环境变量。 2, 直接修改pyspark,将 vim ./bin/pysaprk, 中的部分修改为 if hash python2.7 2>/dev/null; then # Attempt to use Python 2.7, if i翻译 2016-08-23 18:40:52 · 1405 阅读 · 0 评论 -
python: ImportError: No module named bz2
envirnment: python3 , centos7在安装sklearn.RandomForestClassifier时提示 ImportError: No module named bz2。 很明显这个python2中没有装bz2的库导致的。 解决方法:yum install bzip2-devel然后需要重新编译一下python3,之后再import bz2就不会提示错误了。./con原创 2017-01-16 10:24:06 · 11631 阅读 · 1 评论