python
心雨心辰
这个作者很懒,什么都没留下…
展开
-
python中list的拷贝与numpy的array的拷贝
1.python中列表list的拷贝,会有什么需要注意的呢? python变量名相当于标签名。 list2=list1 ,直接赋值,实质上指向的是同一个内存值。任意一个变量list1(或list2)发生改变,都会影响另一个list2(或list1)。 eg: list1[2]=88 list1 [1, 2, 88, 4, 5, 6]原创 2016-06-15 15:46:51 · 36592 阅读 · 2 评论 -
win7 anaconda2 安装xgboost
本人用python做数据分析,经常用到pandas,调用sklearn,于是偷个了小懒,直接安装了anaconda,它集成了很多python的工具包,安装也简单。 最近了解了一下GBM(gradient boosting machine),下面博客是一位寒小阳老师根据某次kaggle大赛上使用GBM处理赛事的流程。 http://blog.csdn.net/han_xiaoyang/artic原创 2016-11-22 17:33:43 · 3277 阅读 · 1 评论 -
anaconda2安装igraph
igraph的python 版本使用 http://igraph.org/python/doc/tutorial/install.html#installing-igraph 因为目前要求packages for Python 2.6, Python 2.7 and Python 3.2, 在我已安装anaconda2(基于Python 2.7的)的前提下,在cmd通过命令pip instal原创 2017-05-24 18:04:23 · 5527 阅读 · 1 评论 -
python27,anaconda2 安装网络绘图工具igraph及cairo
igraph原创 2017-06-01 16:22:23 · 3667 阅读 · 1 评论 -
python 判断为空nan, null
pandas 空值定义为numpy.nan对整体的series或Dataframe判断是否未空,用isnull() eg: pd.isnull(df1) #df1是dataframe变量对单独的某个值判断,可以用 np.isnan() eg: np.isnan(df1.ix[0,3]) #对df1的第0行第3列判断nan遇到问题解决:http://www.cnblogs.com/itdyb/原创 2017-03-14 13:54:40 · 122933 阅读 · 3 评论 -
python 快速排序法
递归实现快速排序法:def quitsort(arr): if len(arr)<=1: return arr pivot=arr[len(arr)/2] left=[x for x in arr if x<pivot] middle=[x for x in arr if x==pivot] right=[x for x in arr if x原创 2017-01-19 14:15:12 · 697 阅读 · 0 评论 -
anaconda 使用import sklearn.model_selection 出错ImportError: No module named model_selection
在anaconda的spider窗口中使用model selection中的函数时,需要import,比如 from sklearn.model_selection import cross_val_score 时出现: ImportError: No module named model_selection 查看原因: 在anaconda中通过如下命令查看sklearn的版本: in:原创 2016-12-19 13:47:55 · 3553 阅读 · 0 评论 -
python出错:local variable XXX referenced before assignment
出错:局部变量XXX在定义前被引用 如上在多次调用函数时使用返回的值bestThreshVal 时,提示local variable bestThreshVal referenced before assignment。 原因是,在这个被调用函数中,bestThreshVal 是在if 条件语句中得到的一个局部值,并返回。应该在for 循环外定义bestThreshVal 一个初值。如下简单例子原创 2016-12-21 15:01:05 · 10948 阅读 · 1 评论 -
python2,绘图title,xlabel,ylabel出现中文乱码
绘制图形时使用了中文标题,会出现乱码 原因是matplotlib.pyplot在显示时无法找到合适的字体。 先把需要的字体(在系统盘C盘的windows下的fonts目录内)添加到FontProperties中。具体解决方法如下: import matplotlib.pyplot as plt from matplotlib.font_manager import FontProp原创 2016-11-28 14:51:46 · 9258 阅读 · 3 评论 -
数据预处理之独热编码(One-Hot Encoding)
比如 sex:[“male”, “female”] country: [‘china’,’USA’,’Japan’] 正常数字量化后: “male”, “female”用0,1表示; ‘china’,’USA’,’Japan’用0,1,2表示。 现在有3个样本: [‘male’,‘USA’], [‘male’,‘Japan’], [‘female’,’China’] 处理后:原创 2016-11-21 16:57:19 · 3646 阅读 · 1 评论 -
anaconda2 打开jupyter Notebook及简单使用
jupyter notebook原创 2016-12-12 11:05:16 · 72844 阅读 · 5 评论 -
winpython,安装与使用(anaconda)
winpython套件包含numpy,scipy,sklearn,matplotlib.等,省去了一个个安装的麻烦,尤其是sklearn在window下安装的各种问题。winpython 的多多优点,参考 http://www.cnblogs.com/starimpact/p/3526146.htmlsklearn机器学习开源工具包,官网上的API介绍很详细,有一些数据集,和例子。可以好好学习机器学原创 2016-04-01 16:03:49 · 11813 阅读 · 1 评论 -
no module named MySQLdb
win7, python27安装MySQLdb。在上一篇提到安装安装MySQL-Python-1.2.5.win32-py2.7 时出现了 not found in the registry 的问题。按照创建新的register.py的方法,可以成功的register.若想要在python27引入import MySQLdb时,会出现 no module named MySQLdb的错误。重新下载w原创 2016-08-02 13:49:25 · 894 阅读 · 0 评论 -
python version 2.7 required,which was not found in the registry
安装MySQL-python-1.2.5.win32-py2.7 (64位系统也可以安装)时,出现问题:python version 2.7 required,which was not found in the registry(但是python2.7已经安装了。) 创建新的register.py文件,代码如下:## script to register Python 2.0 or later原创 2016-08-02 11:57:21 · 1022 阅读 · 0 评论 -
推荐算法之 slope one 算法
1.示例引入多个吃货在某美团的某家饭馆点餐,如下两道菜:可乐鸡翅: 红烧肉: 顾客吃过后,会有相关的星级评分。假设评分如下: 评分 可乐鸡翅 红烧肉 小明 4 5 小红 4 3 小伟 2 3 小芳 3 ? 问题:请猜测一下小芳可能会给“红烧肉”打多少分?原创 2016-07-15 12:03:30 · 21358 阅读 · 4 评论 -
python 划分数据集为训练集和测试集
sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_splitfrom sklearn.cross_validation import train_test_split#x为数据集的feature熟悉,y为label.x_train, x_test, y_train, y_test = train_test_spli原创 2016-12-05 10:42:07 · 57132 阅读 · 7 评论