(十八)数据分析中的一些概念
HIKAI
29 SEP 2017
0 Comments
矢量、向量、标量
矢量和向量是一个东西,只是在不同领域里面用到的不同称呼。矢量常常用在物理学中,向量在数学、几何中比较常见,同时具有大小和方向的量。与向量相对的是只有大小没有方向的标量。
数组(array)与矩阵(matrix)
两者最直观的区别,数组中的元素可以是字符等,矩阵中的元素只能是数。因为矩阵是一个数学概念(线性代数里的),数组是个计算机上的概念。
从外观形状和数据结构上看,二维数组和数学中的矩阵没有区别。但是矩阵作为一种变换或者映射算子的体现,矩阵运算有着明确而严格的数学规则。而数组运算是Matlab软件所定义的规则,其目的是为了数据管理方便、操作简单、指令形式自然和执行计算的有效。虽然数组运算尚缺乏严谨的数学推理,虽然数组运算仍在完善和成熟中,但是它的作用和影响正随着matlab的发展而扩大。
序列/序列型的对象
序列是一类基本数据类型(字符串/列表/元组)的统称,这些数据类型都含有一些共同的特性。例如:可以包含有若干个元素,这些元素有序排列,并且可以通过下标索引来访问到其中的一个或几个元素。
序列类型包含了:String字符串、Tuple元组、List列表。
秩
向量化/矢量化编程实现Vectorized implementation
向量化编程是提高算法速度的一种有效方法,它使你不用编写循环即可对数据执行批量运算。为了提升特定数值运算操作(如矩阵相乘、矩阵相加、矩阵-向量乘法等)的速度,数值计算和并行计算的研究人员已经努力了几十年。矢量化编程的思想就是尽量使用这些被高度优化的数值运算操作来实现我们的