自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

转载 scipy模块介绍

SciPy 是基于Numpy构建的一个集成了多种数学算法和方便的函数的Python模块。通过给用户提供一些高层的命令和类,SciPy在python交互式会话中,大大增加了操作和可视化数据的能力。通过SciPy,Python的交互式会话变成了一个数据处理和一个system-prototyping环境,足以和MATLAB,IDL,Octave,R-Lab,以及SciLab抗衡。  更重要的是,在P

2013-12-23 14:03:42 8731 1

原创 python科学计算六:scipy矩阵操作

1、scipy.sparse.coo_matrix(arg1,shape=None,dtype=None,copy=False):  坐标形式的一种稀疏矩阵。优点:快速的和CSR/CSC formats转换、允许重复录入缺点:不能直接进行科学计算和切片操作   1)、构造过程: coo_matrix(D): with a dense matrix D

2013-12-23 12:01:18 36668 6

原创 sklearn学习记录三:cross-validation

官方cross-validation模型评估方式详细说明 模型评估(预测的质量):存在三种方式来评估预测结果的质量1、Estimator score method:每个估计模型都有自己的评价方式,可以直接使用2、Scoring parameter:模型评价工具使用cross-validation(cross_validation.cross_val_score和grid_sea

2013-12-21 21:00:20 18705 1

转载 sklearn学习记录二:数据预处理

(1)数据标准化(Standardization or Mean Removal and Variance Scaling)进行标准化缩放的数据均值为0,具有单位方差。scale函数提供一种便捷的标准化转换操作,如下: [python] view plaincopy>>> from sklearn import preprocessi

2013-12-21 20:56:07 4511 1

转载 sklearn学习记录一:官方使用说明

本文参考官方网站:http://scikit-learn.org/stable/tutorial/basic/tutorial.htmlscikit-learn工具包自带一些标准数据集(包括iris和digits两个数据集),可以进行测试。(1)首先导入模块数据集:from sklearn import datasetsiris = datasets.load_iris()di

2013-12-21 20:53:04 4061

转载 python基础一:list

• 列表简介:o 列表是序列对象,可包含任意的Python数据信息,如字符串、数字、列表、元组等o 列表的数据是可变的,我们可通过对象方法对列表中的数据进行增加、修改、删除等操作o 可以通过list(seq)函数把一个序列类型转换成一个列表• 列表对象支持的方法:o 1.append(x),在列表尾部追加单个对象x,使用多个参数会引起异常o 2.count(x),返回对象x

2013-12-21 11:51:22 708

转载 Scikit Learn: 在python中机器学习

Scikit Learn: 在python中机器学习 Warning 警告:有些没能理解的句子,我以自己的理解意译。 翻译自:Scikit Learn:Machine Learning in Python作者: Fabian Pedregosa, Gael Varoquaux 先决条件 Numpy, Scipy IPython matplotlib scik

2013-12-20 00:30:05 1424

原创 python科学计算五:sklearn学习

官方资料http://scipy-lectures.github.io/advanced/scikit-learn/index.html

2013-12-19 22:59:28 1437

转载 python科学计算四:pandas

Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel

2013-12-18 16:05:53 14195

原创 python科学计算三:nltk api查询

http://nltk.org/search.html

2013-12-18 16:03:01 1119

转载 python科学计算二:scikit-learn

经Edwin Chen的推荐,认识了scikit-learn这个非常强大的python机器学习工具包。这个帖子作为笔记。(其实都没有笔记的意义,因为他家文档做的太好了,不过还是为自己记记吧,为以后节省若干分钟)。如果有幸此文被想用scikit-learn的你看见,也还是非常希望你去它们的主页看文档。主页中最值得关注的几个部分:User Guide几乎是machine learning的索引,各

2013-12-18 01:31:45 3069

转载 判别模型、生成模型与朴素贝叶斯方法

1判别模型与生成模型上篇报告中提到的回归模型是判别模型,也就是根据特征值来求结果的概率。形式化表示为,在参数确定的情况下,求解条件概率。通俗的解释为在给定特征后预测结果出现的概率。 比如说要确定一只羊是山羊还是绵羊,用判别模型的方法是先从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。换一种思路,我们可以根据山羊的特征首先学习出一个山羊模型,然后

2013-12-17 17:53:04 753

原创 python科学计算一:pandas

numpy和scipy是数值计算的扩展包,pandas是主要用来做数据处理(numpy依赖),sympy做符号计算,此外还有一些不太成熟的包如sciki learn,但是成熟度不如R。下面是pandas的文档http://pandas.pydata.org/pandas-docs/dev/10min.html

2013-12-17 17:50:52 1737

转载 matplot.pyplot

来源代码:matplotlib帮助文档Matplotlib.pyplot是用来画图的方法,类似于matlab中plot命令,用法基本相同。一.最基本的:例如:In [1]: import matplotlib.pyplot as pltIn [2]: plt.plot([1,2,3])Out[2]: []In [3]: plt.ylabel('some numbers'

2013-12-13 14:30:27 1412

转载 numpy使用手册

先决条件在阅读这个教程之前,你多少需要知道点python。如果你想重新回忆下,请看看Python Tutorial.如果你想要运行教程中的示例,你至少需要在你的电脑上安装了以下一些软件:PythonNumPy这些是可能对你有帮助的:ipython是一个净强化的交互Python Shell,对探索NumPy的特性非常方便。matplotlib将允许你绘

2013-12-13 10:45:19 7431

转载 python编辑器

发信人: RunningOn (挥着翅膀的男孩), 信区: Python标  题: python IDE比较与推荐我先给一个初步的表格吧,大家如果有什么意见,或有补充,欢迎提出。有些我没有用过,先不写了。以下是我使用过的python IDE:除了PythonWin, VisualPython只支持Windows,其它都至少支持Win/Linux/Mac。各项含义:

2013-12-12 16:24:15 836

转载 推荐系统开源资料收集

收集和整理了目前互联网上能找到的开源推荐系统,并附上了个人的一些简单点评(未必全面准确),这个列表是目前为止比较全面的了,希望对大家了解掌握推荐系统有帮助(文/陈运文)SVDFeature由上海交大的同学开发,采用C++语言,代码质量很高。去年我们参加KDD竞赛时用过,很好很方便,而且出自咱们国人之手,所以置顶推荐!项目地址:http://svdfeature.

2013-12-09 15:34:29 1243

转载 Learning to Rank之Ranking SVM 简介

排序一直是信息检索的核心问题之一,Learning to Rank(简称LTR)用机器学习的思想来解决排序问题(关于Learning to Rank的简介请见我的博文Learning to Rank简介)。LTR有三种主要的方法:PointWise,PairWise,ListWise。Ranking SVM算法是PointWise方法的一种,由R. Herbrich等人在2000提出, T.

2013-12-08 11:26:40 1352

转载 第一届大学生全国数据挖掘邀请赛#的数据集分析

今天下午有点时间,研究了下#第一届大学生全国数据挖掘邀请赛#的数据集,顺便写个酱油贴。数据集版权归 上海花千树信息科技有限公司 世纪佳缘交友网站 http://www.love21cn.com 所有此处省略相关废话51句,详细介绍走这边,http://www.statmodelingcompetition.com。咱们先了解下这次比较的评分标准:Normalized Disco

2013-12-06 17:26:11 1358 1

原创 ICML 机器学习

http://icml.cc/2014/10.html加油

2013-12-06 17:24:27 874

转载 Machine Learning for Large Scale Recommender Systems--Yahoo! Research

http://pages.cs.wisc.edu/~beechung/icml11-tutorial/ICML'11 Tutorial on Machine Learning for Large Scale Recommender SystemsDeepak Agarwal and Bee-Chung ChenYahoo! Research{dagarwal,beechun}@

2013-12-06 17:21:35 1424

转载 python sort使用

Python list内置sort()方法用来排序,也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。1)排序基础简单的升序排序是非常容易的。只需要调用sorted()方法。它返回一个新的list,新的list的元素基于小于运算符(__lt__)来排序。>>> sorted([5, 2, 3, 1, 4])[1, 2, 3, 4,

2013-12-06 00:18:46 828

转载 python中的random使用

很多网络演化编程中都会用到生成随机数,今天找了一下随机数说明手册,整理一下:(1)random.seed([x])伪随机数生成模块。如果不提供 seed,默认使用系统时间。使用相同的 seed,可以获得完全相同的随机数序列,常用于算法改进测试。>>>from random import *>>>a = Random(); a.seed(1)>>>[a.randint(1,

2013-12-05 12:00:02 6266

转载 【转】推荐系统入门实践:世纪佳缘会员推荐(完整版)

推荐系统入门实践:世纪佳缘会员推荐(完整版)版本作者联系日期1.0周巍然[email protected]严 程supersteven198701

2013-12-05 10:22:06 2732 1

原创 机器学习视频

http://work.caltech.edu/library/

2013-12-05 10:20:33 780

转载 Recommender Systems Handbook读书笔记

《Recommender Systems Handbook》,市面上不多的关于推荐系统的书之一。2010年10月出版,英文版。目前还没有中文版,估计出中文版的可能性不大,读者数量太少了。全书871页,比较厚。Amazon.com上这本书还没有读者评论,看来在英语世界里“推荐系统“这个主题也相对比较冷。这本书断断续续看了三个月。总体感觉还是很不错。由一群相关领域的研究人员集体编写,每一章都有几位

2013-12-05 10:16:30 1898

转载 牛人共享的各种互联网资料

http://qun1.yunpan.360.cn/file/index/?gid=10073410#%2F

2013-12-05 10:13:09 709

转载 [转]推荐系统(Recommender System)的技术基础

亚马逊的CEO Jeff Bezos曾经说过,他的梦想是“如果我有100万个用户,我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想,即通过数据挖掘技术,为每一个用户实现个性化的推荐结果,让每个用户更便捷的获取信息。为了实现这个梦想,过去十余年间,无数顶尖技术专家和工程师投身于推荐算法和技术的研究与应用中,很多优秀的方法被提出,很多技术难题被攻克。在今天的互联网应用中,越来越多“

2013-12-05 10:11:25 1379

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除