python 数据处理
文章平均质量分 79
Nicole_Liang
这个作者很懒,什么都没留下…
展开
-
Python Pandas与Numpy中axis参数的二义性
Stackoverflow.com是程序员的好去处,本公众号将以pandas为主题,开始一个系列,争取做到每周一篇,翻译并帮助pandas学习者一起理解一些有代表性的案例。今天的主题就是Pandas与Numpy中一个非常重要的参数:axis.(轴)Stackoverflow问题如下:python中的axis究竟...转载 2018-04-08 13:51:16 · 193 阅读 · 0 评论 -
Python嵌套列表转一维(压平嵌套列表)
前一段去云英面试,技术官很”不厚道“了问了一个非常简单的问题:如何将多维列表转化了一维的?当时虽然想到了使用迭代或者列表生成式可以做到,但是可以没能可行的代码,回来后一顿后悔。 对于规范的且嵌套维度较低的多维列表,python中有很多方法可以...转载 2018-04-24 09:55:34 · 3180 阅读 · 1 评论 -
python pandas 聚合与分组函数
1 主要内容DataFrame.groupby().sum()DataFrame.groupby().agg()pandas.concat([DataFrame1,DataFrame2])pandas.merge(DataFrame1,DataFrame2,parameters….)DataFrame1.join(DataFrame2,lsuffix=’列名 on DataFrame1’,rsuf...转载 2018-05-10 23:31:04 · 1800 阅读 · 0 评论 -
Pandas使用DataFrame进行数据分析比赛进阶之路(一)
这篇文章中使用的数据集是一个足球球员各项技能及其身价的csv表,包含了60多个字段。数据集下载链接:数据集1、DataFrame.info()这个函数可以输出读入表格的一些具体信息。这对于加快数据预处理非常有帮助。import pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('dataset/soccer/train...转载 2018-05-18 18:10:33 · 645 阅读 · 0 评论 -
python 数据结构(Data Structure)
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt一、Data Structure1.List列表是Python自带的数据结构,是一个按照定顺序存储对象的数据结构。通常通过索引访问列表,索引从0开始。(1)修改列表:给列表赋值x = [1,1,1]x[1] = 2 #使用索引法给特定位置...原创 2018-04-04 10:56:18 · 8595 阅读 · 0 评论 -
Numpy中Meshgrid函数介绍及2种应用场景
Meshgrid函数的基本用法在Numpy的官方文章里,meshgrid函数的英文描述也显得文绉绉的,理解起来有些难度。可以这么理解,meshgrid函数用两个坐标轴上的点在平面上画网格。用法: [X,Y]=meshgrid(x,y) [X,Y]=meshgrid(x)与[X,Y]=meshgrid(x,x)是等同的 [X,Y,Z]=meshgrid(x,y,z)生成三维数组,可用来计算三变...转载 2018-06-02 21:49:00 · 6462 阅读 · 1 评论 -
pandas.cut与pandas.qcut使用方法与区别
pandas.cut:pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)参数:x,类array对象,且必须为一维,待切割的原形式 bins, 整数、序列尺度、或间隔索引。如果bins是一个整数,它定义了x宽度范围内的等宽面元数量,但是在这种情况下,...转载 2018-06-05 11:08:14 · 3144 阅读 · 0 评论 -
PYTHON-基础-时间日期处理小结
目录涉及对象1. datetime2. timestamp3. time tuple4. string5. datedatetime基本操作1. 获取当前datetime2. 获取当天date3. 获取明天/前N天4. 获取当天开始和结束时间(00:00:00 23:59:59)5. 获取两个datetime的时间差6. 获取本周/本月/上月最后...转载 2018-09-18 13:57:34 · 389 阅读 · 0 评论 -
python中的接口
什么是接口 ?接口只是定义了一些方法,而没有去实现,多用于程序设计时,只是设计需要有什么样的功能,但是并没有实现任何功能,这些功能需要被另一个类(B)继承后,由 类B去实现其中的某个功能或全部功能。个人的理解,多用于协作开发时,有不同的人在不同的类中实现接口中的各个方法。在python中接口由抽象类和抽象方法去实现,接口是不能被实例化的,只能被别的类继承去实现相应的功能。个人觉得接...转载 2018-04-09 09:05:37 · 351 阅读 · 0 评论 -
Python学习笔记(1)__name__变量
Python使用缩进对齐组织代码的执行,所有没有缩进的代码,都会在载入时自动执行。每个文件(模块)都可以任意写一些没有缩进的代码,并在载入时自动执行。为了区分 主执行代码和被调用文件,Python引入了变量:__name__。1)当文件是被调用时,__name__的值为模块名;2)当文件被执行时,__name__的值为 ‘__main__’。基于此特性,为测试驱动开发提供了很好的支持,...转载 2018-04-09 10:55:27 · 190 阅读 · 0 评论 -
Python类中的 私有变量和私有方法
版权声明:转载请标注出处。 原文章地址:点击打开链接。https://blog.csdn.net/sxingming/article/details/52875125默认情况下,Python中的成员函数和成员变量都是公开的(public),在python中没有类似public,private等关键词来修饰成员函数和成员变量。在python中定义私有变量只需要在变量名或函数名前加上 ”__“两...转载 2018-04-09 14:07:38 · 1806 阅读 · 2 评论 -
numpy基础:数据和矢量计算
NumPy基础:数组和矢量计算numpy(numerical python的简称)是高性能科学计算和数据分析的基础包,其主要功能如下: 1.快速高效的多维数组对象 ndarray; 2.直接对数组执行数学运算及对数组执行元素级计算的函数; 3.线性代数运算、随机数生成; 4.将 C、C++、Fortran 代码集成到 Python 的工具等。一、numpy中的nda...原创 2018-04-05 17:02:39 · 1271 阅读 · 0 评论 -
python简介
Python是一种解释性,面向对象,动态数据类型的搞基程序设计语言1.特点 1.解释性语言:开发过程中没有了变异环节,类似于PHP 2.交互式语言:可以在一个Python提示符,直接互动执行程序 3.面向对象语言:支持面向帝乡的风格或者代码封装在对象的编程技术 4.初学者的语言 2.发展历史 1.在80年代末90年代初设计出来的 2.Python本身是诸多起亚语言发展来的 3.现在由一个核心开发团...原创 2018-04-05 12:02:00 · 145 阅读 · 0 评论 -
怎样理解 REST、RESTful
本文虽然是参考别人的内容,但是是作者花很多心思整理出来,整理本文章的目的是为了自己可以好理解REST和方便其他人理解,如果要转载,请征求作者意见!一、什么是API? 为了解释清楚REST,必须理解API。API(Application Programming Interface,应用程序编程接口),通俗来讲就是像一个公司比如腾讯、阿里之类,他们可以提供一个API,然后我们或者其他的小公司可以...原创 2018-04-11 18:02:21 · 3683 阅读 · 1 评论 -
python set集合运算(交集,并集,差集,对称差集)
版权声明:本文为转载文章,原文地址:https://blog.csdn.net/sxingming/article/details/51922776点击打开链接1》交集>>> x={1,2,3,4}>>> y={3,4,5,6}>>> xset([1, 2, 3, 4])>>> yset([3, 4, 5, 6])>&g转载 2018-04-09 15:24:30 · 1988 阅读 · 0 评论 -
10 Minutes to pandas(pandas官方网站的翻译)
本文主要参考官方网站对pandas的介绍,加上自己的理解,有不对的地方多多包涵哈!!!pandas模块介绍 ##通常会加载以下模块import pandas as pdimport numpy as npimport matplotlib.pyplot as plt一、创建对象1.通过列表的值创建Series Series是pandas提供的以为数组,它类似于numpy中的...原创 2018-04-04 09:21:10 · 2683 阅读 · 0 评论 -
python merge、concat合并数据集
数据规整化:合并、清理、过滤pandas和python标准库提供了一整套高级、灵活的、高效的核心函数和算法将数据规整化为你想要的形式!本篇博客主要介绍:合并数据集:.merge()、.concat()等方法,类似于SQL或其他关系型数据库的连接操作。合并数据集1) merge 函数参数参数 说明left 参与合并的左侧DataFrameright 参与合并的右侧DataFramehow 连...转载 2018-04-04 10:07:54 · 298 阅读 · 0 评论 -
pandas的层次化索引
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt一、pandas的层次化索引层次化索引是pandas的一项重要功能,它使你能够在一个轴上拥有多个(两个以上)索引级别。换句话来说,它能够让你以低纬度的形式处理高纬度数据。1.Series的层次化索引¶(1)生成数据 data = pd....原创 2018-04-04 14:38:17 · 2309 阅读 · 0 评论 -
python中os模块用法
一、os模块概述Python os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的。(一语中的)二、常用方法1、os.name输出字符串指示正在使用的平台。如果是window 则用'nt'表示,对于Linux/Unix用户,它是'posix'。2、os.ge...转载 2018-04-17 11:10:17 · 62926 阅读 · 5 评论 -
python装饰器–原来如此简单
python装饰器–原来如此简单今天整理装饰器,内嵌的装饰器、让装饰器带参数等多种形式,非常复杂,让人头疼不已。但是突然间发现了装饰器的奥秘,原来如此简单。。。。# -*- coding:gbk -*-'''示例1: 使用语法糖@来装饰函数,相当于“myfunc = deco(myfunc)”但发现新函数只在第一次被调用,且原函数多调用了一次'''def deco(func): p...转载 2018-04-17 11:18:41 · 8720 阅读 · 4 评论 -
NumPy的详细教程(官网手册翻译)
先决条件在阅读这个教程之前,你多少需要知道点Python。如果你想从新回忆下,请看看Python Tutorial.如果你想要运行教程中的示例,你至少需要在你的电脑上安装了以下一些软件:PythonNumPy这些是可能对你有帮助的:ipython是一个净强化的交互Python Shell,对探索NumPy的特性非常方便。matplotlib将允许你绘图Scipy在NumPy的基础上提供了很多科学模...转载 2018-04-17 11:29:00 · 188 阅读 · 0 评论 -
《利用python进行数据分析》读书笔记
《利用python进行数据分析》读书笔记--第四章 numpy基础:数组和矢量计算第四章 Numpy基础:数组和矢量计算第一部分:numpy的ndarray:一种多维数组对象实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面向数组的计算能有助于理解后面的pandas.按照课本的说法,作者关心的功能主要集中于:用于数据整理和清理、子集构造和过...转载 2018-04-17 11:32:06 · 564 阅读 · 0 评论 -
装饰器和偏函数
1. 装饰器 2. 偏函数 3. 变量的作用域 4. 异常处理 5. 文件读写 读文件 写文件 编码与解码 1. 装饰器概念:是一个闭包,把一个函数当做参数返回一个替代班的函数,本质上就是一个返回函数的函数。def func1(): print('the bryce is handsome')def outer(func): ...转载 2018-05-13 19:02:41 · 249 阅读 · 0 评论