三、Python2.x 数据的获取与表示

最新推荐文章于 2021-12-20 10:15:35 发布

禾如月

最新推荐文章于 2021-12-20 10:15:35 发布

阅读量911

点赞数

分类专栏： python 2 文章标签： python

本文链接：https://blog.csdn.net/xiu_star/article/details/70157191

版权

python 2 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

3.1本地数据获取

注意，打开文件要记得关闭文件

文件的打开

file_obj = open(filename,mode = 'r',buffering = -1)

filename：强制参数，必须要有的参数

mode：为可选参数，模式参数，默认为'r'也就是读；'w'为写

buffering：可选参数，默认为-1, 0代表不缓冲，1或大于1的值表示缓冲一行或指定缓冲区大小，注意，为了读写速度快，使用缓冲

调用open()函数返回的是一个文件（file）对象

文件对象可迭代，因此可以遍历其中每一个子项

有关闭方法和许多读写相关的方法/函数

f.read(),f.write(),f.readline(),f.readlines(),f.writelines()

f.close()

f.seek()

写文件：

file_obj.write(str)：将一个字符串写入文件

读文件：

file_obj.read(size)

从文件中至多读出size字节数据，返回一个字符串

file_obj.read()

读文件直到文件结束，返回一个字符串

其他读写函数

file_obj.readlines() #将数据从文件中一行一行地读出来，返回一个列表（注意，这里并不删除换行符，同样写的时候也不会加入换行符需要自己加入）

file_obj.readline()

file_obj.writelines()

其他文件相关函数

file_obj.seek(offset,whence = 0)

在文件中移动文件指针，从whence（ 0表文件头部，1表当前位置，2表文件尾部）偏移offset个字节

whence参数可选，默认值为0

例如f.seek(1,50) 表示从当前位置向后移动50个字节

标准文件

当程序启动后，一下三种标准文件有效

stdin 标准输人

stdout 标准输出

stderr 标准错误

补充资料：

Python中的os模块提供了执行文件和目录处理操作的函数，例如重命名和删除文件。

要使用这个模块，必须先导入该模块，然后才可以调用相关的各种功能。

import os

os.renames(current_file_name,new_file_name) #文件重命名

os.remove(file_name) #删除文件

os.mkdir(newdir) #创建目录

os.chdir(newdir) #改变目录

os.getcwd() #获得当前路径

os.rmdir(dirname) #删除目录

3.2网络数据的获取

抓取网页，解析网页内容，以下是Python的标准库

urllib

urllib2 #可以用来处理更底层的应用

httplib

httplib2 #http的专用库

利用urllib库获取网络数据

可以通过urllib.urlopen()函数获取网络数据到本地 #urllib.urlopen('网址')

使用接下来的函数进行处理：

f.read(),f.readline(),f.readlines()

f.close()

其中还可以结合正则表达式等方式

3.3序列

序列是Python最基本的数据结构，共有6中序列，其中常用的有字符串，列表和元组。

序列中每个元素都有一个跟位置相关的序号，称之为索引。对于一个有N个元素的序列来说，第一个元素的索引从0开始，最后一个为N-1；当然也可以从最后一个元素开始计数，最后一个为-1，那么第一个就为-N。

字符串，列表，元组的共性问题：

索引：例如有7个元素的序列：从左到右是0到6的索引；从右到左是-1到-7进行索引；
序列对象是可迭代的，一次可以访问一个或者多个元素，也叫切片；
序列相关操作：
- - - 标准类型运算符：值比较（<、>、<=、>=、==、！=）；对象身份比较（is、is not）；布尔运算（not、and、or）
    - 序列类型运算符：获取（[::,-1]表示逆序）；重复（*）；连接（+）；判断（in）
    - 内建函数：序列类型转换工厂函数（list()——转成列表、str() 、tuple() ——转成元组、unicode() 、basestring() ）；序列类型可用内建函数（len() ——计算参数的长度、sorted() ——排序、sum() 、max() 、min() 、zip() 、reversed() 、enumerate() ）