机器学习---SciPy入门

1.安装SciPy

pip install scipy

2.SciPy包
翻译仅供参考

SciPyFunctionalities(机能)
cluster (群(簇))分层次的群(簇) clustering.hierarchy 矢量量化 cluster.vq
constants (常量)物理的和数学的常量,转换方法
fftpack描述傅里叶变换的算法
integrate集成的常规
interpolate插入(线性的,立体的等等)
io数据的输入和输出
linalg使用最佳化的BLAS和LAPACK库的常规的线性算法
ndimagen维度的图片包
odr正交回归距离
optimize最佳化
signal信号处理
sparse稀疏矩阵
spatial空间数据结构和算法
special特殊的数学函数(如贝叶斯)
stats统计学工具包

3.输入数据
模拟输入某网站每小时的点击量,数据存放在data.txt文件中

import sripy as sp
data = sp.genfromtxt('data.txt', delimiter=',')
print(data[:10])
print(data.shape)

3.预处理和清除数据
在SciPy中分离由两个向量组成的维度是很方便的。x向量包含小时以及其他的内容。y向量包含每小时的点击量。

x = data[:,0]
y = data[:,1]

检查数据中是否包含无效的数据

sp.sum(sp.isnan(y))

排除数据中的无效数据

x = x[~sp.isnan(y)]
y = y[~sp.isnan(y)]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值