【python】数据处理基本操作---持续更新

文件导入数据

data = pd.read_csv(path,header,names=['','']     #返回DataFrame对象

#画图
data.plt(kind='scatter',x='',y='')       #scatter散点图
plt.show()

导入数据基本操作

str.strip('char')         用于移除字符串**头尾**指定的字符(默认为空格)或字符序列。
split()   分隔

Numpy

import numpy as np

np.r_[a,b] 
#是按行连接两个矩阵,就是把两矩阵上下相连,要求列数相等,类似于pandas中的 concat()。
np.c_[a,b] 
#是按列连接两个矩阵,就是把两矩阵左右相连,要求行数相等,类似于pandas中的 merge()。

判断符串中是否存在某个字符串

print(“ring” in “strings”) #True
print(“wow” in “amazing!”) #False
print(“Yes” in “yes!”) #False
print("" in “No way!”) #True

python读写文件

读写文件基本使用 with open…as…方式,这样子安全!

with open('path','method') as f:
	f.read()  #可读取整个文件,也可自行设置大小,如 f.read(100)
	f.readline()  #一次读取一行
	f.readlines()  #可读取整个文件,按行读取
	f.write(text)  #写入text内容
	f.close()   #关闭文件
	

method类型:

method描述
r打开一个文件用于只读。文件指针将会放在文件的开头。
rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。
r+打开一个文件用于读写。文件指针将会放在文件的开头。
rb+以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
w+打开一个文件用于读写 。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb+以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件进行写入。
ab以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

Json模块dumps、loads、dump、load函数

1、json.dumps()

用于将dict类型的数据转成str,因为如果直接将dict类型的数据写入json文件中会发生报错,因此在将数据写入时需要用到该函数。

import json

dict = {'a':'1111','b':'2222','c':'3333','d':'4444'} 
str = json.dumps(dict)
print(dict)
print(str)

#输出结果
{'a': '1111', 'c': '3333', 'b': '2222', 'd': '4444'}   #字典类型
{"a": "1111", "c": "3333", "b": "2222", "d": "4444"}   #字符串类型
2、json.loads()

用于将str类型的数据转成dict

import json

dict1 = {'a':'1111','b':'2222','c':'3333','d':'4444'} 
str = json.dumps(dict)
dict2 = json.loads(dict1)

#输出结果,  'a'变成了u'a'是因为发生了类型转换,str会转换成unicode
{'a': '1111', 'c': '3333', 'b': '2222', 'd': '4444'}
{"a": "1111", "c": "3333", "b": "2222", "d": "4444"}
{u'a': u'1111', u'c': u'3333', u'b': u'2222', u'd': u'4444'}

附上python转换类型

3、json.dump()

用于将dict类型的数据转成str,并写入到json文件中。下面两种方法都可以将数据写入json文件

import json

#方法一:
str = json.dumps(dict)    
with open('file_name', "w") as f:  
    f.write(str) 
    
方法二:
json.dump(dict, open('file_name', "w"))
4、json.load()

从json文件中读取数据

import json

emb_filename = ('/home/cqh/faceData/emb_json.json')  
 
jsObj = json.load(open(emb_filename))    
 
print(jsObj)
print(type(jsObj))
 
for key in jsObj.keys():
    print('key: %s   value: %s' % (key,jsObj.get(key)))


#运行结果
{u'a': u'1111', u'c': u'3333', u'b': u'2222', u'd': u'4444'}
<type 'dict'>
key: a   value: 1111
key: c   value: 3333
key: b   value: 2222
key: d   value: 4444

HTTP 请求 requests

import requests,json

url = '...'
r = requests.get(url)   
data = json.dumps(r.json())  
 
print(type(r))                   #requests.models.Response类型
print(type(r.json()))                  #dict / list数据类型
print(type(data))                  #返回str数据类型
r.text     		#HTTP响应内容的字符串形式,即:url对应的页面内容	
r.content       #HTTP响应内容的二进制形式












  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值