Python
文章平均质量分 61
Chloezhao
这个作者很懒,什么都没留下…
展开
-
实验1—将所有数据处理为矩阵
trainMatrix, testRatings = load_data('yelp.rating')def load_data(ratingFile, testRatio=0.1): user_count = item_count = 0 ratings = [] for line in open(ratingFile): arr = li原创 2017-01-11 12:00:26 · 1393 阅读 · 0 评论 -
将数据集切分成“训练-测试数据集”和交叉验证
如何将数据集划分为测试数据集和训练数据集?把数据集分为两部分:分别用于训练和测试sklearn提供一个将数据集切分成训练集和测试集的函数。from sklearn.crose_validation import train_test_splitXd_train,Xd_test,y_train,y_test=train_test_split(X_d,y,random_state=14)原创 2016-12-07 11:05:04 · 22524 阅读 · 0 评论 -
libfm in python
https://github.com/coreylynch/pyFM这是一个 python 实现的分解机 [1]。使用自适应正则化作为一种学习方法,适应正规化训练模型参数时,自动使用随机梯度下降。详情,请参阅 [2]。从 libfm.org:"分解机 (FM) 是允许通过来模拟大多数分解模型的特征工程的泛型方法。这种方式,分解机"相结合特征工程概论凭借优势的分解模型估计的大域分类变量之原创 2016-12-05 16:10:18 · 10403 阅读 · 4 评论 -
python语法基础-cPickle.dump使用
cPickle.dump使用原创 2016-11-20 18:27:19 · 13396 阅读 · 0 评论 -
python-加载数据集
python加载数据集原创 2016-11-18 09:20:44 · 7662 阅读 · 0 评论 -
python报错集锦
1.python WindowsError: [Error 3]2.python中绝对路径和相对路径问题3.WindowsError: [Error 183] : python原创 2016-11-18 12:34:49 · 1852 阅读 · 0 评论 -
【问题】ValueError: numpy.dtype has the wrong size, try recompiling解决
python报错ValueError: numpy.dtype has the wrong size, try recompiling问题解决原创 2016-11-17 11:23:13 · 13628 阅读 · 1 评论 -
数据挖掘学习-准备篇-python编辑
模块的导入:模块位置 把写的script1放在我们安装Python的位置:然后开始-运行-python:import script110. import,from 和 reload模块只可以导入一次 导入是一个开销很大的操作,以至于每个程序运行只可以导入一次。想再次运行除转载 2016-11-10 09:56:33 · 463 阅读 · 0 评论 -
数据挖掘学习-准备篇-python基础
python科学计算1.使用python内置数据集from sklearn import datasetsiris = datasets.load_iris()>>> print(iris.data) [[ 0. 0. 5. ..., 0. 0. 0.] [ 0. 0. 0. ..., 10. 0. 0.] [原创 2016-11-07 09:36:57 · 833 阅读 · 0 评论 -
数据挖掘学习-准备篇-机器学习基础
机器学习基础: a. 机器学习基础是——归纳generalize,从已知数据中找未知规律; b. Tom Mitchell定义“一个程序在完成任务T(task)后获得经验E(experience),其表现为效果P(performance);如果它完成任务T(task)的效果为P(performance),那么就获得经验E(experience)”;监督学习、无监督学习原创 2016-11-06 11:15:33 · 766 阅读 · 0 评论 -
数据挖掘学习-准备篇-环境搭建
1.python安装2.python下numpy安装3.python下scipy安装4.python下sklearn安装原创 2016-11-05 18:56:53 · 1709 阅读 · 0 评论 -
实验2——建模
建模buildModle def buildModel(self): loss_pre = sys.float_info.max nonzeros = self.trainMatrix.nnz hr_prev = 0.0 sys.stderr.write("Run for BPR. \n") for itr原创 2017-01-11 20:05:36 · 1007 阅读 · 0 评论