习题原文链接:minfanphd
1. 集合
1.1 朴素的定义
Definition 1. A set is a collection of elements, and an element is an object in a set.
集合的两种表示法:
a) 列举法,如: = ,,,,,,,,,;
b) 谓词法,如: = ∣ mod = .
习题1:{0,1,{0,1},{1,2}}有几个元素?机器学习中,这类形式的集合有什么优点和缺点?
- 上述集合有4个元素,分别是0、1、{0,1}、{1,2} ,其中元素{0,1}为一个集合,它的元素为0、1,元素{1,2}也为一个集合,它的元素为1、2。
- 优点:集合中的元素是确定的,且集合可以容纳多种类型的数据。
- 缺点:判断一个对象是否为指定集合的元素需一一对比;不同的维度出现重复的数据,可能意味着同一对象的重复表达,给问题的解决增添复杂。
1.2 基数
集合 的基数,即其元素的个数,记为 ||,读的时候,需读成“the cardinality of A”.
习题2:∅ 的基数是多少? {∅} 呢?
- ∅ 是没有元素的集合,因此∅的基数为0。
- {∅} 不是空集,该集合里有一个∅元素,因此{∅} 的基数为1。
1.3 笛卡尔积
Definition 2. The Cartesian product of is = .
笛卡尔积不满足结合律,如 ={
}, = {
}, = {
}.那么 = {( )}, ( ) = (( ) ), 同理 ( ) = ( ( )).
数据集的两种表示法:
a) 矩阵表示法:记 = , ,则 , 可支持矩阵的相乘,易于表示加权等操作;
b) 集合与向量混合法:记 = {
, },其中 ,元素可随意交换顺序,但不允许两个元素相同。
1.4 幂集
Definition 2. The power set of is given by = {
}.
例: = {1,2,3}, = {
,{1},{2},{3},{1,2},{1,3},{2,3},{1,2,3}}.幂集里的