自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 欠拟合、过拟合总结

 一开始我们的模型往往是欠拟合的,也正是因为如此才有了优化的空间,我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了 过拟合和欠拟合的判断首先就是我们在进行模型训练的时候会出现模型不能够很好地拟合数据的情况,这个时候就需要我们来判断究竟现在的模型是欠拟合还是过拟合首先看一下三种误差的计算方法:training error   训练误差...

2018-08-08 23:31:25 1184

原创 损失函数总结

损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,衡量模型预测的好坏。它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可以表示成如下式子:其中,前面的均值函数表示的是经验风险函数,L代表的...

2018-08-08 22:09:41 2323

原创 陌陌笔试题总结 算法岗

内容:推荐算法:基于用户,基于内容,重点学习关联推荐算法:Apriori和FP-Growth欧式距离,曼哈顿距离,切比雪夫距离聚类算法:k-means银行家算法计算机网络:7层协议及功能静态路由,动态路由一面:项目介绍,特别详细,详细到我项目中的树是怎么建的,每方面怎么考虑的。算法:1。分类和聚类哪个熟悉?答分类2。分类算法中你用过哪个,详细介绍一下:结合项目介绍的朴素贝叶斯(音乐推荐系统),LG...

2018-04-11 23:18:44 3267 1

转载 k-means聚类中k值与初始簇中心的选择

1.手肘法1.1 理论手肘法的核心指标是SSE(sum of the squared errors,误差平方和),其中,Ci是第i个簇,p是Ci中的样本点,mi是Ci的质心(Ci中所有样本的均值),SSE是所有样本的聚类误差,代表了聚类效果的好坏。       手肘法的核心思想是:随着聚类数k的增大,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和SSE自然会逐渐变小。并且,当k小于...

2018-03-22 08:17:39 8209 1

原创 同步异步 阻塞非阻塞 Linux网络io模型

聊聊同步、异步、阻塞与非阻塞 - 简书  https://www.jianshu.com/p/aed6067eeac9聊聊Linux 五种IO模型 - 简书  https://www.jianshu.com/p/486b0965c296socket初探https://www.jianshu.com/p/02ec5504b919聊聊IO多路复用之select、poll、epoll详解 - 简书  h...

2018-03-01 18:30:43 225

原创 基于机器学习的办理银行贷款预测

该项目是补课班老师留的作业,比较简单,用来练手,熟悉流程适合机器学习初学者来实践#如何判断某些属性和特征与结果是否关联                #首先通过相关人员进行简单筛选,也可以通过画图和求相关系数来发现#例如,通过画age与最终贷款的柱状图,如果各个年龄下,差别不大,证明年龄关系不大,可以去掉。#某个特征如果单独来看,和最终结果关系不大,它与其他的特征组合也不会有影响,因此可以不用考虑...

2018-02-27 21:39:51 2437

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除