python: ImportError: No module named bz2

envirnment: python3 , centos7在安装sklearn.RandomForestClassifier时提示 ImportError: No module named bz2。 很明显这个python2中没有装bz2的库导致的。 解决方法:yum install bzip...

2017-01-16 10:24:06

阅读数 5662

评论数 0

spark&pthon MLlib逻辑回归

环境:mac osx python3.5 由于系统自带的python是2.7版本,所以需要进行配置修改。 1, 添加pyspark对应的python的系统环境变量。 2, 直接修改pyspark,将 vim ./bin/pysaprk, 中的部分修改为 if hash python2.7 2...

2016-08-23 18:40:52

阅读数 1021

评论数 0

gensim中实践LDA

????from sklearn import datasets news_dataset=datasets.fetch_20newsgroups(subset="all",remove=("headers","footers",&quo...

2016-08-01 23:53:39

阅读数 8403

评论数 1

L0,L1,L2正则化--广义线性模型

L0范数表示向量中非零元素的个数 L1正则化表示各个参数绝对值之和。 L1正则化使得模型更加稀疏。L2正则化标识各个参数的平方的和的开方值。 L2使得模型参数更趋近于0,提高泛化能力。参考文章: L0,L1,L2正则化浅析 http://blog.csdn.net/vividonly/...

2016-07-31 01:06:36

阅读数 1340

评论数 0

特征选择--scikit-learn

特征选择(Feature Selection):choosing a subset of all the features(the ones more informative)。最终得到的特征选是原来特征的一个子集。 特征选取是机器学习领域非常重要的一个方向。 主要有两个功能: (1)减少特...

2016-07-29 12:28:12

阅读数 27519

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭