20181213笔记

20181213笔记

  1. loadtxt
    loadtxt(fname, dtype=<class ‘float’>, comments=’#’, delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)
    np.loadtxt()用于从文本加载数据。文本文件中的每一行必须含有相同的数据。
A B C
1 2 3
4 5 6
7 8 9

a = np.loadtxt('test1.txt', skiprows=1, dtype=int)
print(a)

delimiter=None
delimiter=','
表示之间有什么来分割开
skiprows=1
这里的skiprows是指跳过前1, 如果设置skiprows=2, 就会跳过前两行, 这里的输出为

[[1 2 3]
[4 5 6]
[7 8 9]]

comment=#的是指, 如果行的开头为#就会跳过该行
usecols=(0, 2), unpack=True
这里的usecols是指只使用0,2两, unpack是指会把每一列当成一个向量输出(eg: [1 4 7] [3 6 9]), 而不是合并在一起。
usecols=[0,2]
只使用1,3两(对比上面!)
converters={0:add_one}用了{ }花括号
最后介绍converters参数, 这个是对数据进行预处理的参数, 我们可以先定义一个函数, 这里的converters是一个字典, 表示第零列使用函数add_one来进行预处理
输出 相当于不输出第一列

2.matplotlib.pyplot.imshow()

matplotlib.pyplot.imshow(
    X, 
    cmap=None, 
    norm=None, 
    aspect=None, 
    interplotation=None, 
    alpha=None, 
    Vmin=None, 
    vmax= None, 
    origin=None, 
    extent=None, 
    shape=None, 
    filternorm=1, 
    filterrad=4.0, 
    imlim=None, 
    resample=None,
    url=None, 
    hold=None, 
    data=None, **kwargs)`
  • X:类数组对象(array_like),shape(n,m) 或者(n,m,3)或者(n,m,4)

    把X表示的图片显示在当前坐标轴中。X可以是类数组形式、或者PIL图片。如果X是类数组,它可以有如下3种情况&类型:

  • MxN - 用来作图的类数组值:float类型 / INT类型

· MxNx3 - RGB类数组值:float类型 / unit8类型

· MxNx4 - RGBA类数组值:float类型 / unit8类型

MxNx3和MxNx4的float类型类数组,取值范围限定为[0.0, 1.0]。MxN类数组是基于norm(采用标量对映射到标量方法作图)和cmap(将标准化标量映射为颜色)。

  • interplotation:默认"None",可用字符串类型命令设定interpolation='nearest'#这是啥意思??
  • cmap=‘Greys’

3.pandas.DataFrame.head()
head()是指输出前几行,如果()内是空的,则输出all

4.pandas.read_csv参数整理
https://www.cnblogs.com/datablog/p/6127000.html
常用:

  • delimiter : str, default None
    定界符,备选分隔符(如果指定该参数,则sep参数失效)
  • header : int or list of ints, default ‘infer’
    指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0,否则设置为None。如果明确设定header=0 就会替换掉原来存在列名。header参数可以是一个list例如:[0,1,3],这个list表示将文件中的这些行作为列标题(意味着每一列有多个标题),介于中间的行将被忽略掉(例如本例中的2;本例中的数据1,2,4行将被作为多级标题出现,第3行数据将被丢弃,dataframe的数据从第5行开始。)。
    注意:如果skip_blank_lines=True 那么header参数忽略注释行和空行,所以header=0表示第一行数据而不是文件的第一行。
  • nrows : int, default None
    需要读取的行数(从文件头开始算起)
    -encoding : str, default None
    指定字符集类型,通常指定为’utf-8’. List of Python standard encodings[https://docs.python.org/3/library/codecs.html#standard-encodings]

5.df.XXX后面可以跟什么

  • df.haed()
  • df.tail()
  • df.index()
  • df.columns
  • df.values 查看数值 后面不用跟()
  • df.describe() 输出dataframe数据类型
  • df.T 转置矩阵
  • df.sort(columns[C]) 对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序。

5.Python pickle模块学习
pickle提供了一个简单的持久化功能。可以将对象以文件的形式存放在磁盘上。
pickle模块只能在python中使用,python中几乎所有的数据类型(列表,字典,集合,类等)都可以用pickle来序列化,

pickle序列化后的数据,可读性差,人一般无法识别。

必填参数file必须以二进制可读模式打开,即“rb”,其他都为可选参数

with open('data.pkl', 'rb') as file:
    d = pickle.load(file)

6.pandas读取excel

# Import pandas
import pandas as pd

# Assign spreadsheet filename: file   ##总是喜欢多一步。。
file = 'battledeath.xlsx'

# Load spreadsheet: xl
xl = pd.ExcelFile(file)
  • 写入了excel后,xl.parse()的参数与上面的https://www.cnblogs.com/datablog/p/6127000.html
    类似
    To skip the first row of data, set skiprows = [0]
    -例子
    df1 = xl.parse(0, parse_cols=[0],skiprows=[0], names=['Country', 'AAM due to War (2002)'])
    skiprows、parse_cols、name都要用list

6.读取SAS

7.读取sql

engine = create_engine('sqlite:///Chinook.sqlite') #sqlite:///

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值