# 数据分析的基础步骤:数据收集,数据处理,数据分析,数据展现
# numpy的安装 pip install numpy
# pandas的安装 pip install pandas
# Matplotlib的安装:pip install matplotlib
#
# jupeter notebook是ipython的升级版 一个Web应用程序 界面更友好 功能也更强大。
# 可创建和共享代码 数据清洗和转换 数值模拟 统计建模 机器学习等等
# jupyter notebook的安装 pip install jupyter
# 启动jupyter notebook
# 数据加载np.genfromtxt
import numpy as np
filename = "./presidential_polls.csv"
data_arr = np.genfromtxt(filename, #需要打开的文件名
delimiter = "," ,#文件的分隔符
dtype=str, #数据按字符串格式存储,不进行bytes编码
usecols = (3,17,18,19),#表示读取文件里列索引位置
)
print(data_arr)
# 数据存储np.loadtxt
filename = "./presidential_polls.csv"
data_arr = np.loadtxt(filename, #需要打开的文件名
delimiter = "," ,#文件的分隔符
#skiprows = 1, #可以选择调过开头指定的行
dtype=str, #数据是按编码后的字符串格式存储
usecols = (3,17,18,19),#表示读取文件里的列的索引位置)
1、numpy数组的创建
# 随机抽样生成数组范围[0, 1)
arr1 = np.random.rand(2, 3, 4)
print(arr1)
print(type(arr1))
[[[0.57574486 0.54646636 0.8826699 0.18578644]
[0.98587593 0.79860098 0.33510005 0.63357311]
[0.57229583 0.78985357 0.94551367 0.50121632]]
[[0.54692874 0.93198596 0.27521756 0.77860668]
[0.72724299 0.29829541 0.96995412 0.01535601]
[0.85714544 0.47116552 0.77156323 0.51256554]]]
<class 'numpy.ndarray'>
# 随机从标准正太分布中返回一个或多个样本值
arr2 = np.random.randn(2, 3, 4)
print(arr2)
print(type(arr2))
[[[-0.23396039 -0.23336667 -0.30112823 -1.23415798]
[ 0.91558245 0.12414881 0.15081818 -1.53843735]
[-0.21620594 0.7359921 0.50092933 0.75558742]]
[[ 0.32530112 0.73525383 0.3721923