20181213笔记

最新推荐文章于 2023-01-31 10:25:10 发布

喝醉的cincin

最新推荐文章于 2023-01-31 10:25:10 发布

阅读量129

点赞数

本文链接：https://blog.csdn.net/qq_39543783/article/details/84982584

版权

20181213笔记

loadtxt
loadtxt(fname, dtype=<class ‘float’>, comments=’#’, delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)
np.loadtxt()用于从文本加载数据。文本文件中的每一行必须含有相同的数据。

A B C
1 2 3
4 5 6
7 8 9

a = np.loadtxt('test1.txt', skiprows=1, dtype=int)
print(a)

delimiter=None
delimiter=','
表示之间有什么来分割开
skiprows=1
这里的skiprows是指跳过前1行, 如果设置skiprows=2, 就会跳过前两行, 这里的输出为

[[1 2 3]
[4 5 6]
[7 8 9]]

comment=#的是指, 如果行的开头为#就会跳过该行
usecols=(0, 2), unpack=True
这里的usecols是指只使用0,2两列, unpack是指会把每一列当成一个向量输出(eg: [1 4 7] [3 6 9]), 而不是合并在一起。
usecols=[0,2]
只使用1,3两列（对比上面！）
converters={0:add_one}用了{ }花括号
最后介绍converters参数, 这个是对数据进行预处理的参数, 我们可以先定义一个函数，这里的converters是一个字典, 表示第零列使用函数add_one来进行预处理
输出相当于不输出第一列

2.matplotlib.pyplot.imshow()

matplotlib.pyplot.imshow(
    X, 
    cmap=None, 
    norm=None, 
    aspect=None, 
    interplotation=None, 
    alpha=None, 
    Vmin=None, 
    vmax= None, 
    origin=None, 
    extent=None, 
    shape=None, 
    filternorm=1, 
    filterrad=4.0, 
    imlim=None, 
    resample=None,
    url=None, 
    hold=None, 
    data=None, **kwargs)`

X：类数组对象(array_like)，shape(n,m) 或者(n,m,3)或者(n,m,4)

把X表示的图片显示在当前坐标轴中。X可以是类数组形式、或者PIL图片。如果X是类数组，它可以有如下3种情况&类型：
MxN - 用来作图的类数组值：float类型 / INT类型

· MxNx3 - RGB类数组值：float类型 / unit8类型

· MxNx4 - RGBA类数组值：float类型 / unit8类型

MxNx3和MxNx4的float类型类数组，取值范围限定为[0.0, 1.0]。MxN类数组是基于norm(采用标量对映射到标量方法作图)和cmap（将标准化标量映射为颜色）。

interplotation：默认"None"，可用字符串类型命令设定interpolation='nearest'#这是啥意思？？
cmap=‘Greys’

3.pandas.DataFrame.head()
head()是指输出前几行，如果（）内是空的，则输出all

4.pandas.read_csv参数整理
https://www.cnblogs.com/datablog/p/6127000.html
常用：

delimiter : str, default None
定界符，备选分隔符（如果指定该参数，则sep参数失效）
header : int or list of ints, default ‘infer’
指定行数用来作为列名，数据开始行数。如果文件中没有列名，则默认为0，否则设置为None。如果明确设定header=0 就会替换掉原来存在列名。header参数可以是一个list例如：[0,1,3]，这个list表示将文件中的这些行作为列标题（意味着每一列有多个标题），介于中间的行将被忽略掉（例如本例中的2；本例中的数据1,2,4行将被作为多级标题出现，第3行数据将被丢弃，dataframe的数据从第5行开始。）。
注意：如果skip_blank_lines=True 那么header参数忽略注释行和空行，所以header=0表示第一行数据而不是文件的第一行。
nrows : int, default None
需要读取的行数（从文件头开始算起）
-encoding : str, default None
指定字符集类型，通常指定为’utf-8’. List of Python standard encodings[https://docs.python.org/3/library/codecs.html#standard-encodings]

5.df.XXX后面可以跟什么

df.haed()
df.tail()
df.index()
df.columns
df.values 查看数值后面不用跟（）
df.describe() 输出dataframe数据类型
df.T 转置矩阵
df.sort(columns[C]) 对数据进行排序，用到了sort，参数可以指定根据哪一列数据进行排序。

5.Python pickle模块学习
pickle提供了一个简单的持久化功能。可以将对象以文件的形式存放在磁盘上。
pickle模块只能在python中使用，python中几乎所有的数据类型（列表，字典，集合，类等）都可以用pickle来序列化，

pickle序列化后的数据，可读性差，人一般无法识别。

必填参数file必须以二进制可读模式打开，即“rb”，其他都为可选参数

with open('data.pkl', 'rb') as file:
    d = pickle.load(file)

6.pandas读取excel

# Import pandas
import pandas as pd

# Assign spreadsheet filename: file   ##总是喜欢多一步。。
file = 'battledeath.xlsx'

# Load spreadsheet: xl
xl = pd.ExcelFile(file)

写入了excel后，xl.parse（）的参数与上面的https://www.cnblogs.com/datablog/p/6127000.html
类似
To skip the first row of data, set skiprows = [0]
-例子
df1 = xl.parse(0, parse_cols=[0],skiprows=[0], names=['Country', 'AAM due to War (2002)'])
skiprows、parse_cols、name都要用list

6.读取SAS
略

7.读取sql

engine = create_engine('sqlite:///Chinook.sqlite') #sqlite:///

喝醉的cincin

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
20181213笔记

20181213笔记loadtxtloadtxt(fname, dtype=&amp;amp;amp;lt;class ‘float’&amp;amp;amp;gt;, comments=’#’, delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)np.loadtxt()用于从文本加载数据。文本文件中的每一行必须含有相同的数据...
复制链接

扫一扫