- 博客(4)
- 收藏
- 关注
原创 过拟合
过拟合在进行逻辑回归和线性回归时可能出现欠拟合和过拟合现象,欠拟合和过拟合均无法有效的应用到未测试数据中,过拟合对输入的实验数据的拟合效果异常完美,但是对未加入的数据拟合结果很差。下面三个图分别代指欠拟合,拟合良好和过拟合。(图片来自大牛吴恩达的课程) 产生过拟合的原因特征量太多,而测试数据太少。解决方法1.人为的舍弃特征量(略)2.正则化正则化的基本思想是在...
2018-09-17 20:47:34 440
原创 Classification----logisitic regression
前言在学习和实践了线性回归模型后,我们终于来到了下一站——分类问题,分类问题中经典的算法称为逻辑回归.逻辑回归模型引入给定一些样本以后,我们首先需要选用一个合适的样本估测函数去估计样本值,首先如果使用线性函数去模拟可以吗?现在想要预测肿瘤良性与肿瘤大小的关系,看下面这些样本在坐标系上的分布. 此时使用线性回归可以得到如下图形:...
2018-09-06 15:45:32 404
原创 查找中的数据结构之无序表和有序表
查找引入在大数据时代,如何在海量数据中快速检索到自己想要的数据?首先需要设计高效的数据结构来表示这些数据,要存储的数据一般分为两个部分,键和值,如何根据键值去安排这些数据尤为重要,首先我们想到线性存储,即利用表的形式线性存储,线性查找,即符号表这种数据结构.符号表符号表线性存储数据,但是根据在插入操作过程中是否保证数据有序分为无序表和有序表:0.无序表无序表API(仅实现了...
2018-09-02 15:52:47 2692
原创 经典排序算法总结
排序算法的应用0.利用算法的整体对各种数据排序在工商业中的各种交易数据,职场,学校中各种员工学生的信息等等.一般涉及数据存储的地方都会有排序算法的应用1.利用算法中的一部分解决某些问题a.逆序对数量与插入排序交换次数的对应关系b.中位数(或寻找第k小的值问题)与快排中切分的思想.2.较复杂算法中应用到排序算法a.优先队列与调度问题b.微积分曲线下区域面积,优先...
2018-09-02 15:06:40 226
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人