data mining
faadfafasd
这个作者很懒,什么都没留下…
展开
-
数据加载,存储与文件格式化
读写文本格式的数据pandas中的解析函数 read_csv/read_table函数的参数 将数据写出到文本格式In[1]: data=pd.read_csv('data1.csv')data.to_csv('data2.csv')手工处理分隔符格式csv语支选项 JSON数据obj= """{"name":"Wes", "places_lived":["United States原创 2016-03-01 15:47:48 · 1043 阅读 · 0 评论 -
数据规整化:清理,转换,合并,重塑
简介数据分析和建模方面的大量编程工作都是用在数据准备上的:加载,清理,转换以及重塑。有时候,存放在文件或数据库中的数句柄不能满足你的数据处理应用的要求。许多人都选择使用通用编程语言(如Python,perl,R或Java)或UNIX文本处理工具(如sed或awk)对数据格式进行专门处理。幸运的是,panads和Python标准库提供了一组高级的,灵活的,高效的核心函数和算法。数据库风格的DataFr原创 2016-03-01 16:43:53 · 1108 阅读 · 0 评论 -
在linux上安装NumPy,Matplotlib,SciPy和IPython
大部分Linux发行版都有NumPy的软件包。 我们将针对一些流行的Linux发行版给出安装步骤。(1) 要在Red Hat上安装NumPy,请在命令行中执行如下命令:yum install python-numpy(2) 要在Mandriva上安装NumPy,请在命令行中执行如下命令:urpmi python-numpy(3) 要在Gentoo上安装NumPy,请在命令行中执原创 2016-02-28 19:07:35 · 665 阅读 · 0 评论 -
IPython使用指南
简介:2001年,Fernando Perez为了得到一个更为高效的交互式Python解释器而启动的一个项目,IPython不仅仅是一个加强版的shell,他可以直接进行绘图操作的GUI控制台,一个基于web的交互式笔记本,以及一个轻量级的快速并行计算引擎。常用命令:1.启动:ipython/ipython qtconsole –pylab=inline 2.Tab键自动补全内省在变量名或命令的前原创 2016-02-28 20:45:44 · 6413 阅读 · 0 评论 -
pandas入门
简介pandas学习网站:http://pandas.pydata.org/ pandas含有使数据更快更简单的高级数据结构和操作工具。pandas是基于NumPy构建的,让以NumPy为 中心的应用变得更加简单pandas的数据结构要使用pandas,首先就得熟悉它的两个主要数据结构:Series和DataFrame。虽然它们并不能解决所有问题,但它们为大多数应用提供了一种可靠的,易于使用的基原创 2016-02-29 21:43:20 · 843 阅读 · 0 评论