1 机器学习应用场景
机器学习广泛用于模式识别、计算机视觉、数据挖掘、语音识别、统计学习、自然语言处理等领域;
2 机器学习一般步骤
训练样本->特征提取->学习函数->预测分析
3 python常用的机器学习库
numpy:科学计算库
pandas:数据分析处理库
matplotlib:数据可视化库
scikit-learn:机器学习库
4 开发环境准备
anacoda 一个集成开发软件,安装成功,可以在pycharm中project interpreter中配置获取以上开发库;
一般命令:
conda list --查看以安装python库的信息
conda install numpy --安装指定库
anaconda search -t conda tensorflow 查询tensorflow库
anaconda show--在l列表中显示库信息
5 numpy库
引自 https://www.yiibai.com/numpy/numpy_data_types.html
5.1 构建矩阵对象
NumPy 中定义的最重要的对象是称为 ndarray 的 N 维数组类型。 它描述相同类型的元素集合。 可以使用基于零的索引访问集合中的项目。
ndarray中的每个元素在内存中使用相同大小的块。 ndarray中的每个元素是数据类型对象的对象(称为 dtype)。
从ndarray对象提取的任何元素(通过切片)由一个数组标量类型的 Python 对象表示。
构造ndarray对象
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
上面的构造器接受以下参数:
参数及描述
object 任何暴露数组接口方法的对象都会返回一个数组或任何(嵌套)序列。
dtype 数组的所需数据类型,可选。
copy 可选,默认为true,对象是否被复制。
order C(按行)、F(按列)或A(任意,默认)。
subok 默认情况下,返回的数组被强制为基类数组。 如果为true,则返回子类。
ndimin 指定返回数组的最小维数。
import numpy as np
# 多于一个维度
a = np.array([[1, 2], [3, 4]])
print(a)
# 最小维度
a = np.array([1, 2, 3, 4, 5], ndmin=2)
# 指定元素类型为复数
a = np.array([1, 2, 3], dtype = complex)
print(a)
5.2