自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 过拟合

过拟合在进行逻辑回归和线性回归时可能出现欠拟合和过拟合现象,欠拟合和过拟合均无法有效的应用到未测试数据中,过拟合对输入的实验数据的拟合效果异常完美,但是对未加入的数据拟合结果很差。下面三个图分别代指欠拟合,拟合良好和过拟合。(图片来自大牛吴恩达的课程) 产生过拟合的原因特征量太多,而测试数据太少。解决方法1.人为的舍弃特征量(略)2.正则化正则化的基本思想是在...

2018-09-17 20:47:34 412

原创 Classification----logisitic regression

前言在学习和实践了线性回归模型后,我们终于来到了下一站——分类问题,分类问题中经典的算法称为逻辑回归.逻辑回归模型引入给定一些样本以后,我们首先需要选用一个合适的样本估测函数去估计样本值,首先如果使用线性函数去模拟可以吗?现在想要预测肿瘤良性与肿瘤大小的关系,看下面这些样本在坐标系上的分布. 此时使用线性回归可以得到如下图形:...

2018-09-06 15:45:32 386

原创 查找中的数据结构之无序表和有序表

查找引入在大数据时代,如何在海量数据中快速检索到自己想要的数据?首先需要设计高效的数据结构来表示这些数据,要存储的数据一般分为两个部分,键和值,如何根据键值去安排这些数据尤为重要,首先我们想到线性存储,即利用表的形式线性存储,线性查找,即符号表这种数据结构.符号表符号表线性存储数据,但是根据在插入操作过程中是否保证数据有序分为无序表和有序表:0.无序表无序表API(仅实现了...

2018-09-02 15:52:47 2635

原创 经典排序算法总结

排序算法的应用0.利用算法的整体对各种数据排序在工商业中的各种交易数据,职场,学校中各种员工学生的信息等等.一般涉及数据存储的地方都会有排序算法的应用1.利用算法中的一部分解决某些问题a.逆序对数量与插入排序交换次数的对应关系b.中位数(或寻找第k小的值问题)与快排中切分的思想.2.较复杂算法中应用到排序算法a.优先队列与调度问题b.微积分曲线下区域面积,优先...

2018-09-02 15:06:40 212

原创 索引优先队列

索引优先队列上篇讲述了优先队列,一种能够快速访问最大元素或最小元素的数据结构,但是考虑这样一种情况,公司按姓名录入员工信息,并按照薪水加入了优先队列,某员工薪水需要更改,假设薪水排名为n,那么我们需要怎样操作呢?首先将前n名员工出列,然后改正第n名薪水,最后将这n名员工入列,操作太复杂,不符合程序员追求性能(懒)的特性,于是想到将优先队列的元素加一个索引,可以随机访问.这种加入索引的优先队列就...

2018-08-31 18:46:21 839

原创 优先队列总结

优先队列引入在生产调度中,事件都有优先级,那么如何快速的调度最高优先级的事件成为一件需要考虑的事情。调度中有两种操作,第一种是调度最高级事件,第二种是插入事件,那么优先队列这种数据结构完美解决了这两个操作,在优先队列中这两种操作完成的任务就是删除队列中最大值和插入新值。优先队列初级实现那么优先队列如何实现呢?简单的可以用数组来实现,有以下两种方法: 1.数据插入随意,数据...

2018-08-28 10:43:09 2912

原创 LeetCode中常见问题

0.未看清是升序还是降序在做Largest Number这道题时,本来需要升序排列,结果一直使用降序排列,导致结果出错,纠结了很久,浪费了大量时间。1.归并排序的merge函数的参数问题归并排序的归并函数merge(vector<int>a,int lo,int mid,int hi),hi的设定影响是否需要归并a[hi],也就是辅助数组的复制是否需要复制到hi位置的元...

2018-08-24 14:21:20 503

原创 归并排序总结

归并排序主要思想归并排序主要将数组分成等量的两部分,然后对每一部分进行排序,然后再将他们合并。与快速排序一样也是利用了分治法的思想,但是不同的是划分方式不同。数组排序过程用以下数组来进行描述: 3 4 10 9 21 18 将数组分成等量的两部分 3 4 10 和9 21 18 然后继续划分,直至划分成单个元素,可以用树形结构进行表示 代码整理那么分治...

2018-08-24 14:12:44 330

原创 MarkDown 编辑所遇问题

0.文字显示不全原因:有些转义字符不可以直接写,需要进行转义: 字符 转义书写格式 < < > > & & “ " ‘ '...

2018-08-23 09:49:45 385

原创 三切分快速排序

三切分快速排序在普通的快速排序中,如果存在一组待排序的子数组全部为重复的元素,我们还对其进行划分排序,这样性能会下降,那么,如何改进存在大量重复元素的数组排序的性能呢?E.W.Dijkstra这个算法界无处不在的大佬提出了荷兰国旗问题,引出了三项切分快速排序的方法。这种方法与普通快排所区分的地方在于划分时不是划分成不大于和不小于两部分,而是划分成小于,等于,大于三部分,这样重复的值就可以不用再...

2018-08-23 09:17:10 1701

原创 快速排序

快速排序快速排序是一种利用了分治法的排序方法,在数组中寻找一个基准量(数组第一个值或者随机选取某个值)每次循环过程中,将待排序的数组分成两组,小于基准量的值位于数组的左侧,大于基准量的值位于数组的右侧,这样每次循环均能够寻找到基准量在数组中的正确位置。 快速排序主要的步骤就是,使用基准量划分数组,然后对划分的数组进行排序。 例如数组: 4 3 5 11 3 7 2 9 将第一个值4当成...

2018-08-22 15:38:42 187

转载 CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...

2018-08-22 14:48:39 117

原创 Algorithm 4th------初级排序算法总结

排序算法  在日常生产生活中,将杂乱的一组数据转换成有顺序的另一组数据所使用的算法叫做排序算法.那么最基础的排序算法都有哪些?0.冒泡排序  主要思想:循环比较相邻数据并交换符合一定条件(升序则为靠前数据大于靠后数据)的数据,第i次循环都会使第i小或第i大的数据交换到正确的位置.伪代码for i=1 to a.length-1: for j=a.length t...

2018-08-21 21:01:45 221

原创 pandas基本操作

1 pandas数据结构1.1 seriess=pd.Series([1,2,3,np.nan,5,6])pandas中的序列,接受参数为列表,默认索引为0,1,2….1.2 DataFramedates=pd.date_range('20180310',periods=6)df = pd.DataFrame(np.random.randn(6,4), index=d...

2018-07-12 20:29:13 183

原创 Numpy教程

一.array属性首先创建一个array: array=np.array([[1,2,3],[3,4,5]] array.ndim #array的维度 array.shape #array的形状 array.size #array数据多少二.array的创建a=np.array(list,dtype)#通用格式 a=np.zeros((m,n))#生成m*n的全零矩阵 ...

2018-07-03 16:51:33 232

原创 Normal Equation

标准化方程在前面的梯度下降法中我们提到过如何用矩阵来表示线性回归:θTX=YθTX=Y\theta^TX=Y那么是否可以直接用矩阵运算来解决参数θθ\theta的取值问题呢?答案是可以的,即利用如下公式便可一步得到θθ\theta的值:θT=Y(XTX)−1XTθT=Y(XTX)−1XT\theta^T=Y(X^TX)^{-1}X^T 但是该式子会引出以下在线性代数的相关问题.为什么不直...

2018-06-22 19:01:21 235

原创 Mutiple Liner Regression

一.多元线性在上一节中提到了线性回归,不过特征量x只有1个,当特征量大于1个时,如下表: 住房面积x1x1x_1 层数x2x2x_2 卧室个数x3x3x_3 住宅年数x4x4x_4 售出价格y 2104 5 1 45 460 1416 3 2 40 232 1534 3 2 30 315...

2018-06-22 16:19:22 230

原创 Liner Regression problem

Model Representation(模型构建)以房价预测为例,假设有如下可供训练的数据集(数据总量为m): 住宅面积 (x) 销售价格(y) 123 45w 145 55w 120 42w … … 80 30w将这些点绘制在直角坐标系上则为: 其中x是住宅面积,y是销售的价格,那么假设预测函数为...

2018-06-21 11:54:34 532

原创 Machine Learning definition

定义机器学习:对于一个具体的任务T,通过学习得到的经验E,不断的调整以优化它的性能P。(例如:对于判断邮件是否为垃圾邮件的任务,通过学习分类后得到的正确的或错误的标签,不断调整来尽可能使大部分标签正确)分类Supervised learning监督学习:给定的数据集有确定的标签,根据这些标签来进行学习,多用于回归(房价的预测)和分类(肿瘤良性判断)英文单词(malignant:恶性,benign:...

2018-06-21 11:53:00 194

原创 算法笔记二分治法

分治法的概念分治法是一种将大规模的问题分解成若干个容易得到结论的小问题,然后递归地将这些小问题一一解决,最后将得到的解进行合并建立原问题的解。关键步骤-分解- -解决- -合并-实例(归并排序)步骤分析分解原问题 首先将要排序的n个元素的序列分为两个n/2的序列递归解决 对分解的子序列进行排序合并子问题的解 合并两个已经排序好的序列编码分析分解只需要进行将原序列分为两份,子序列排序递

2017-07-13 21:51:48 374

原创 Algorithms unlocked summary one

Algorithms unlocked 笔记一马上要进行考研和保研的复习,便打开了Algorithms unlocked这本书来复习数据结构与算法这门课。什么是算法?算法其实是发生在生活中的每时每刻,点点滴滴,它是解决一件事情的步骤,比如说买东西,首先要列好购物清单,然后拿着购物清单去超市选择东西,最后到前台付账。然而算法在计算机中是不能这样笼统描述的,它需要更准确,更抽象,抽象精确到机器可以理解的

2017-07-11 22:52:03 249

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除