自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

法术技能书

立志成为大法师的博客

  • 博客(14)
  • 收藏
  • 关注

原创 Python大数据分析之Pandas入门基础1

在开始大数据分析之前,需要了解Pandas的基础知识: 1. 数据结构:数据在Pandas的处理过程中存在的形式,决定了数据特性和数据处理流程; 2. 主要的功能函数:包括索引、重新索引、数据的增删改、排序与排名等; 3. 常见的运算函数:加减乘除、绝对值、统计值等等; 4. 附加功能:文件读取、数据库交互、网站API等(粗略介绍,后续专题)。

2019-08-31 17:48:43 321

原创 Numpy和Pandas中关于axis的定义和理解

数据分析的数组函数中(Series和DataFrame……),常常会涉及到轴参数的设置:axis=0、1。1.当 axis=0 == axis=index,意味着:数组中的所有元素(包括行索引(index)),都被视为(单独的)列向量;在各列向量、或单独一列的行索引上,执行相应操作。2.当 axis=1 == axis=columns,意味着:数组中的所有元素(包括列索引(columns))...

2019-08-29 18:00:47 354

原创 Python的Numpy入门基础2

NumPy作为Python的常用库,主要实现数组的计算和分析。上回书说到:NumPy数组创建、索引、切片、转置的定义和注意事项;顺其自然,就涉及到矩阵的运算:A.数学函数:针对数组和元素的通用函数,包含单个数组的一元函数:开方、指数、取整、判断NaN等;也包含多个数组的二元函数:加、减、相乘、整除、大小比较等;还有比较特殊的矩阵计算:点乘。一元函数: np.sqrt( ) ...

2019-08-28 19:30:24 289

原创 Python的Numpy入门基础1

NumPy作为Python的常用库,主要实现数组的计算和分析,其优点是直接进行数组计算,相比Python的嵌套列表,更加高效。在功能上,与Pandas存在一定的相似性。引用库的方法:import numpy as np #一般缩写为np,方便后续的引用在数据分析过程中,存在创建定义、索引、切片、矩阵转置等。在矩阵定义过程中,常用的几种方式:x=np.array([1,2,3,4]...

2019-08-23 17:52:36 262

原创 Python的strip模块、正则表达式(部分)

Python的strip( )模块,主要功能是去除首尾字符;如果没有定义,则默认为去除空格或换行符。str.strip( ‘0’ );在字符串 str 中,去除“0”字符,返回去除后的字符串;str.title( ); 字符串 str 转换为标题格式,首字母大写,其余字母小写;待续……正则表达式:re.sub(pattern, repl, string, count=0)...

2019-08-22 17:48:47 702

原创 Python的函数初探

函数:作为编程中最主要的一部分内容,需要重点关注。在Python中,函数需要预先声明:def functionname( ): for value in string: # 在函数中定义中间变量,并作为返回值用于主程序 value = ……return value返回值return 可以返回多个值,return a, b, c;如果函数中没有 ret...

2019-08-22 17:37:13 155

原创 Python数据结构:推导式(系列:列表、元组、字典、集合)

推导式:即在数据中,依据一定的条件进行数据操作,各种数据结构的推导式的应用结构大体相同,列表与集合的推导式只是括号形式的不同,[ ] 和 { };字典的推导式,则多出一个key值。列表: a= [expr for x in list if conditions]集合: b= {expr for x in strings if conditions}字典: c={key_exp...

2019-08-21 18:17:27 322

原创 Python数据结构:集合初探(系列:列表、元组、字典、集合)

集合,作为Python的一种数据结构,具有一定的特点:无序、不可重复、不可变。创建集合的函数:set( [……] )或者{ }。Tips:在创建集合的过程中,会自动删去重复的元素;在创建集合的过程中,会自动对元素进行排序;排序方式:当元素只有数字时,按照数字的数值大小排序;当元素有多种类型时,数字在字母前面,数字按照首位数字,从小到大排序,字母按照a~z,依次排列。集合还存在多种...

2019-08-21 18:04:59 148

原创 Python数据结构:列表与元组差异(系列:列表、元组、字典、集合)

列表与元组可以相互转换:a=[……],a = list( ),定义的列表:长度可变,内容可修改tuple( ), 元组的转换,定义额元组:不可修改

2019-08-21 17:46:10 274

原创 Python数据结构:字典初探(系列:列表、元组、字典、集合)

字典,作为Python的重要数据结构,具有其特有的命名原则和结构。字典的创建方式dic{键:值,键:值,……};其中键作为每个元素的名字,值为每个单元的数值。字典类似于Matlab的元胞数组,只是在其基础上,增加各元胞的名称,便于调用。字典类型的数据,存在如下基本的操作方式:元素的添加:dic[5]=‘some value’,即在字典数据的末尾,增加5:‘some value’这一元素...

2019-08-19 18:57:57 204

原创 Python中列表的range函数、列表切片、sort函数、enumerate函数、bisect二分查找

在for… in…循环中,常常涉及到依次取值迭代,就需要对列表的取值进行定义,用到range( )函数。range( )函数的使用方法:tips:range(起点,终点,步进)函数是只包含起点,不包含终点;range(10),默认 0 为起点,1 为步进;== range(0,10,1);range(0,20,2),为正常格式,常用于迭代。列表切片:等同于range( )函...

2019-08-19 18:40:46 1383

转载 python在办公软件上的应用

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。原文链接

2019-08-17 08:47:23 4834

原创 Python在处理时间序列上的实际时间戳处理模块datatime

在采集数据的过程中,不可避免的存在各行数据时间戳的存在,在后续的时间序列处理中,可能存在需要依据时间戳进行数据分析,必然涉及到Python的datetime模块。在开始编程之前,一如既往的导入模块:from datetime import datetime, date, timedatetime()模块存在一个默认的时间格式,例如:(2019,8,16,14,0,26)单独对赋值参数 t...

2019-08-16 19:28:16 546

原创 Python的append赋值注意事项

Python的变量存在两种类型:可变类型和不可变类型。因此,对不同类型变量的赋值存在两种模式:一种浅层次赋值(非绑定赋值);一种深层次赋值(绑定赋值)。(涉及变量的地址和数值,还没弄清楚)当我们需要使用append函数时,需要注意:新变量的改变会影响整个相关联的变量。例如:a=[1,2]b=ab.append(3)print(type(b),a,b)输出的结果为:<class...

2019-08-15 19:05:03 6219

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除