自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大锅八十小锅四十

伪数据挖掘,伪机器学习,通信狗转cs汪一只,https://tinkle1129.github.io/

  • 博客(13)
  • 资源 (2)
  • 收藏
  • 关注

原创 过拟合、欠拟合、正则化

过拟合和欠拟合产生原因 欠拟合:模型学习能力不足(太简单),无法学习到数据的真实分布,即模型的期望输出和真实输出之间有很大的差异,高偏差。过拟合:模型学习能力过分(太复杂),因噪声干扰等因素导致数据的分布有轻微的波动,但是模型也学习到了,导致模型的训练结果得到的数据分布过分依赖于所输入的数据,高方差。从模型泛化程度上理解,欠拟合的模型在训练集和测试集上表现不足,而过拟合的模型尽管在训练...

2018-03-26 09:51:44 795

原创 集成学习专题之GBDT面试

题目和答案来自于网络,相关链接已贴。 春招不易,且学且珍惜~Q1:GBDT的算法流程? A:GBDT是通过采用加法模型(基函数的线性组合),不断减小训练过程产生的残差来达到将数据分类或者回归的算法。针对一般损失函数优化困难问题,利用损失函数的负梯度在当前模型的值作为残差的近似值进行求解。Q2:GBDT如何选择特征?(CART Tree中的特征选择方法) A:遍历每个特征,然后对每个特...

2018-03-24 21:17:08 2439

原创 Leetcode Math知识点总结

728. Self Dividing Numbers:返回[left,right+1]区间内所有自分数的列表(自分数即该数%各位上的数=0,含0的数不是自分数), Easyclass Solution(object): def selfDividingNumbers(self, left, right): """ :type left: int...

2018-03-22 16:05:56 465

转载 机器学习面试题整理

持更中。。。(最近电脑卡得要死) 主要focus在场景题上一、2015百度校招笔试题 (1)垃圾邮件分类问题 1. 垃圾邮件分类特征? 2. 训练集中99%非垃圾、1%垃圾,训练模型视为100%非垃圾,准确率?召回率? 3. 在实际的应用场景中,尽可能地找回垃圾邮件,应该怎么办? (2)求元素之和最大的子数组 (解答:dp) (3)从字符串流中随机选择一个字符串 【从字符串流中...

2018-03-20 14:16:05 279

原创 算法专题训练(3)回文字符串

516. Longest Palindromic Subsequence:求字符串中最大回文子串(不一定连续)的最大长度 将s翻转成s1 求s和s1的最长公共子序列长度 可以先判断下s是否是回文 另外一个思路 dp[i][j] = dp[i + 1][j - 1] + 2 if s[i] == s[j] dp[i][j] = max(dp...

2018-03-17 21:23:07 252

原创 八大排序算法

参考 理了一下八大排序(to do list好多年终于填掉了) 人是真的要锤大锤打才能成长起来哇~ 舍友过生日,先撤了~# - * - coding:utf8 - * - -'''@Author : Tinkle G@Creation Time: 2018/03/16'''class Solution(object): ########################...

2018-03-16 20:46:15 274

原创 算法专题训练(2)小偷问题

198. House Robber:小偷不能偷相邻的房子,求最大收益class Solution(object): def rob(self, nums): size = len(nums) if size == 0: return 0 if size <=2: return max(nums) Values =...

2018-03-13 21:00:26 3168

原创 Leetcode 动态规划知识点总结

来看下Leetcode中Tag为Dynamic Programming的题目股票买卖系列小偷光顾房子系列斐波那列序列及其变种70. Climbing Stairs:爬山问题,Easy dp[i] = dp[i-1]+dp[i-2]746. Min Cost Climbing Stairs:爬山问题,需要支付cost[i]费用,Easyclass Sol...

2018-03-13 20:42:53 388

原创 算法专题训练(1)股票问题

121. Best Time to Buy and Sell Stock:股票一次买入卖出,求最大利润class Solution(object): def maxProfit(self, prices): if prices == []: return 0 minNum,ret = prices[0],0 for p in pr...

2018-03-10 11:04:15 783

原创 Leetcode 栈知识点总结

来看下Leetcode中Tag为Stack的题目[Leetcode 739] Daily Temperatures:求下一个温暖天气距离当前日期的时间差。Mediumclass Solution(object): def dailyTemperatures(self, temperatures): """ :type temperatures...

2018-03-07 09:06:39 833

原创 Leetcode 递归知识点总结

自古套路留人心,发现自己对递归这块掌握的真的是“感人肺腑“(最近的语文水平断崖式下跌哎)来看下Leetcode中Tag为Recursion的题目 [Leetcode 687] Longest Univalue Path:给定二叉树,求节点值全部相等的最长路径。路径不一定要通过树根。Easy# Definition for a binary tree node.# clas...

2018-03-06 11:26:18 826

原创 性能度量(模型评价)

分类结果混淆矩阵 ——预测 预测 正例 TP FN 反例 FP TN 准确率: acc = (TP+FP)/(TP+TN+FP+FN) 查准率或精度Precision: P=(TP)/(TP+FP) 查全率或者灵敏性或者召回率Recall: R=(TP)/(TP+FN) P-R曲线:横坐标为P,纵坐标为R,平衡点BEP满足P=R的取...

2018-03-05 21:39:19 375

原创 Leetcode 位运算知识点总结

一个颇有好感的爱豆今天入伍了,人品和才华都没的说,但是因为这样或那样的原因,最终不得已提前进了部队,挺心疼他的。明年年底见吧。 昨天刷B站,看到国内一个练习生选秀节目中舞蹈导师批评国内练习生各种借口各种不努力,不禁感慨国内娱乐圈来钱太容易了。韩国爱豆生存压力大,每年出道的团很多,但是最后活下来的就那么几个。所以为了成功,他们需要不断努力不停练习,最终的表现和国内高下立判。 环境是很大的一个方面...

2018-03-05 11:05:12 521

统计学习方法笔记(部分算法含matlab代码)

以李航《统计学习方法》为参考,包含自己的理解和部分相关代码~有所不对请大家指出,新手上路,请多指教。

2015-11-17

N-臂老虎机算法(强化学习)

关于强化学习N-臂老虎机算法的理解,包括部分代码和算法流程图

2015-10-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除