机器学习杂烩篇
ml_nick
没有最高,只有更高
展开
-
【机器学习杂烩篇】Pandas merge( )合并
merge( )合并需要指定连接键。多对一的合并操作on参数指明单个连接键In [5]: df1=pd.DataFrame({'key':['b','b','a','a','b','a','c'],'data1':range(7)})In [6]: df2=pd.DataFrame({'key':['a','b','d'],'data2':range(3)})In [7]...转载 2019-02-18 01:13:50 · 624 阅读 · 0 评论 -
【机器学习杂烩篇】Python两个内置函数—locals 和globals
这两个函数主要提供,基于字典的访问局部和全局变量的方式。在理解这两个函数时,首先来理解一下python中的名字空间概念。Python使用叫做名字空间的东西来记录变量的轨迹。名字空间只是一个字典,它的键字就是变量名,字典的值就是那些变量的值。实际上,名字空间可以象Python的字典一样进行访问每个函数都有着自已的名字空间,叫做局部名字...转载 2019-02-18 00:12:39 · 159 阅读 · 1 评论 -
【机器学习杂烩篇】pandas Map和replace
import pandas as pdimport numpy as npfrom pandas import Series, DataFramedf1 = DataFrame({"城市":["北京","上海","广州"], &a转载 2019-02-18 00:21:18 · 168 阅读 · 0 评论 -
【机器学习杂烩篇】Pandas中的qcut和cut
qcut与cut的主要区别: qcut:传入参数,要将数据分成多少组,即组的个数,具体的组距是由代码计算 cut:传入参数,是分组依据。具体见示例 1、qcut方法,参考链接:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.qcut.html 1).参数:pandas.qcut(x, q, label...转载 2019-02-17 13:46:43 · 651 阅读 · 0 评论 -
【机器学习杂烩篇】Pandas 排序sort_values
1 排序 按照某一列的大小进行排序。Py3目前提供两个函数。 1.1 sort_index 这个函数似乎不建议使用了,推荐使用sort_values详情参看:官方文档。 ## 参数sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quickso...转载 2019-02-17 13:21:29 · 364 阅读 · 0 评论 -
【机器学习杂烩篇】pandas fillna()函数详解
inplace参数的取值:True、FalseTrue:直接修改原对象False:创建一个副本,修改副本,原对象不变(缺省默认)method参数的取值 : {‘pad’, ‘ffill’,‘backfill’, ‘bfill’, None}, default Nonepad/ffill:用前一个...转载 2019-02-17 13:09:46 · 9906 阅读 · 0 评论 -
【机器学习杂烩篇】详解 Pandas 透视表(pivot_table)
介绍也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为 pivot_table。虽然pivot_table非常有用,但是我发现为了格式化输出我所需要的内容,经常需要记住它的使用语法。所以,本文将重点解释pandas中的函数 pivot_table,并教大家如何使用它来进行数据分析。如果你对这个概念不熟悉,维基百科上对它做了详细的解释。顺便说一下...转载 2019-02-17 11:43:04 · 452 阅读 · 0 评论 -
【机器学习杂烩篇】关于python中axis=0还是axis=1的讨论
首先请看一下官方帮助的解释:轴用来为超过一维的数组定义的属性,二维数据拥有两个轴:第0轴沿着行的垂直往下,第1轴沿着列的方向水平延伸。注意看,官方对于0和1的解释是轴,也就是坐标轴。而坐标轴是有方向的,所以千万不要用行和列的思维去想axis,因为行和列是没有方向的,这样想会在遇到不同的例子时感到困惑。根据官方...转载 2019-02-15 23:08:20 · 486 阅读 · 1 评论