【算法】20180904算法笔记整理

1、机器学习中的模型

组合特征的方式:
- 非参数化:如KNN
- 参数化(权重)

学习知识——修正知识(损失函数)——应用

提取特征描述样本X——训练——不成熟模型——迭代优化——理想模型

2、特征工程、回归模型、模型工程
两种特征数据:数值特征数据、类别特征数据
数据预处理:处理数据缺失、归一化数值特征数据、按特征标签展开类别/特征数据

构造新特征的数学意义:
增加特征维度,构造出模型表达不出来的内在表达式
特征“非线性”表达:本身非线性因素、特征之间非线性关联、影响分类结果

本身:多项式(高次方,表达能力增强)、离散化(区间划分、逼近真实)

3、欠拟合与过拟合
测试集错误:高—低—高
模型适应力:高-低
训练集错误:高-低

4、NP-Complete的性质

  • 想要有效率地(指拥有多项式时间O(n^k)时间复杂度的确定性算法)解决一些NP难题,目前无法做到
  • 利用Choice(),集合NP可以包含一部分这样的难题(如满足性问题)
  • 多项式时间转换的关系可以被用来讨论这些难题之间的关系
  • 满足性问题可以在多项式时间内转换成NP-Hard和NP-Complete中的任意一个难题
  • 任意一个NP内的问题都可以在多项式时间内被转换成满足性问题

5、逼近算法

  • 最小点覆盖问题
  • 装箱问题
  • 平面旅行商问题

6、随机算法
- 拉斯维加斯算法
- 蒙特卡洛算法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据结构与算法是计算机科学的基础和核心领域之一,第ba章介绍了数据结构的相关内容。 本章主要包括以下几个方面的内容: 1. 线性结构:线性结构是指数据元素之间存在一对一的关系,包括线性表、栈和队列。线性表是最基本的数据结构之一,它分为顺序表和链表两种形式。顺序表使用数组实现,插入和删除操作相对低效。链表使用指针实现,插入和删除操作较为灵活。 2. 树结构:树结构是一种层次结构,由节点和边组成。常见的树结构有二叉树、二叉搜索树和平衡二叉树等。二叉树中每个节点最多有两个子节点,二叉搜索树中左子节点的值小于根节点,右子节点的值大于根节点,查找效率较高。平衡二叉树是一种保持左右子树高度差不大于1的二叉搜索树。 3. 图结构:图结构是由节点和边组成的非线性结构。图分为有向图和无向图。图的表示方法有邻接矩阵和邻接表两种。深度优先搜索和广度优先搜索是图的常用遍历方法,可用于寻找路径、连通分量等问题。 4. 排序算法:排序算法是对一组无序数据进行按照某个规则进行有序排列的算法。第ba章介绍了常见的排序算法,包括冒泡排序、插入排序、选择排序、归并排序、快速排序等。每种排序算法的时间复杂度和空间复杂度不同,选择合适的排序算法可以提高性能。 5. 查找算法:查找算法是在一组数据中搜索某个特定元素的算法。第ba章介绍了顺序查找、二分查找和哈希查找等常见的查找算法。二分查找是在有序数组中应用最广泛的查找算法,通过不断缩小查找范围来快速定位目标值。 通过学习这些内容,我们可以了解不同数据结构的特点和应用场景,以及常见的排序和查找算法。掌握好这些知识,对于解决实际问题和提高程序效率都有很大帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值