大锅八十小锅四十

伪数据挖掘,伪机器学习,通信狗转cs汪一只,https://tinkle1129.github.io/

机器学习面试题

平时想到啥就记下来,慢慢补。 算法笔试复习 性能度量(模型评价) 优化算法 Logistic Regression 决策树 支持向量机 贝叶斯分类器 聚类算法 Boosting、Bagging和Stacking EM算法 过拟合、欠拟合、正则化 内容来源 机器学习面试10...

2018-01-18 10:42:12

阅读数 358

评论数 7

Leetcode String 知识点总结

551. Student Attendance Record I:一堂课不合格的条件是:两次及以上的缺席(‘A‘)或连续三次的迟到(‘L‘),给定一个字符串,求该学生是否合格,Easy class Solution(object): def checkRecord(self, s...

2018-05-25 11:56:05

阅读数 226

评论数 0

Leetcode Tree 知识点总结

95. Unique Binary Search Trees II:返回由[1,2,…,n]组成的所有二叉搜索树的列表,Medium. 思路:先确定root,在递归获取root.left和root.right # Definition for a binary tree...

2018-05-16 14:02:55

阅读数 207

评论数 0

Leetcode Array 知识点总结

832. Flipping an Image:将数据先水平翻转,再01交换,返回数据。Easy class Solution(object): def flipAndInvertImage(self, A): "&quot...

2018-05-16 10:42:26

阅读数 145

评论数 0

树模型特征重要性评估方法

前言 在特征的选择过程中,如果学习器(基学习器)是树模型的话,可以根据特征的重要性来筛选有效的特征。本文是对Random Forest、GBDT、XGBoost如何用在特征选择上做一个简单的介绍。 各种模型的特征重要性计算 Random Forests 袋外数据错误率评估 RF...

2018-05-07 21:28:33

阅读数 3048

评论数 3

Leetcode Shell 编程

195. Tenth Line:显示文件第10行的内容,Easy sed –help;查看具体使用规则: sed -n ‘xp’ filename;显示文件X行命令: sed -n ‘x,yp’ filename;显示文件X行到Y行的内容: 193. Valid Pho...

2018-04-23 11:17:17

阅读数 109

评论数 0

Leetcode Hash Table知识点总结

454. 4Sum II:求满足A[i]+B[j]+C[k]+D[l] = 0的 (i,j,k,l)个数,Medium http://bookshadow.com/weblog/2016/11/13/leetcode-4sum-ii/ 利用字典cnt,将A,B中各元素(笛卡尔积...

2018-04-22 11:19:30

阅读数 82

评论数 0

Leetcode Binary Search 知识点总结

744. Find Smallest Letter Greater Than Target:返回目标字母target插入到有序字母列表letters后下一个字母,如果target无下一个字母,则返回letters[0],Easy 二分插入 index = bisect.bise...

2018-04-22 11:07:06

阅读数 115

评论数 0

Leetcode TwoPointer知识点总结

344. Reverse String:字符串转置,Easy 定义头尾指针,调换对应的字符 class Solution(object): def reverseString(self, s): ""&...

2018-04-18 15:10:08

阅读数 223

评论数 0

Leetcode Array知识点总结

804. Unique Morse Code Words:统计单词翻译成摩斯电码后摩斯电码的个数,Easy set class Solution(object): def uniqueMorseRepresentations(self, words): ...

2018-04-18 09:46:49

阅读数 121

评论数 0

Leetcode DFS知识点总结

Depth-first-search 104. Maximum Depth of Binary Tree:求树的最大深度, Easy class Solution(object): def maxDepth(self, root): "&q...

2018-04-07 12:44:15

阅读数 347

评论数 1

LS-PLM学习笔记

论文链接 Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction 首先介绍了传统的解决方案和局限性 (1)LR不能捕捉非线性 (2)GBDT+LR虽然能够产生非线性特征组合,但是树模型不...

2018-04-02 15:44:54

阅读数 682

评论数 0

过拟合、欠拟合、正则化

过拟合和欠拟合 产生原因 欠拟合:模型学习能力不足(太简单),无法学习到数据的真实分布,即模型的期望输出和真实输出之间有很大的差异,高偏差。 过拟合:模型学习能力过分(太复杂),因噪声干扰等因素导致数据的分布有轻微的波动,但是模型也学习到了,导致模型的训练结果得到的数据分布过分依赖于所输入的...

2018-03-26 09:51:44

阅读数 579

评论数 0

集成学习专题之GBDT面试

题目和答案来自于网络,相关链接已贴。 春招不易,且学且珍惜~ Q1:GBDT的算法流程? A:GBDT是通过采用加法模型(基函数的线性组合),不断减小训练过程产生的残差来达到将数据分类或者回归的算法。针对一般损失函数优化困难问题,利用损失函数的负梯度在当前模型的值作为残差的近似值进行求解。 ...

2018-03-24 21:17:08

阅读数 923

评论数 0

Leetcode Math知识点总结

728. Self Dividing Numbers:返回[left,right+1]区间内所有自分数的列表(自分数即该数%各位上的数=0,含0的数不是自分数), Easy class Solution(object): def selfDividingNumbers(self,...

2018-03-22 16:05:56

阅读数 157

评论数 0

机器学习面试题整理

持更中。。。(最近电脑卡得要死) 主要focus在场景题上 一、2015百度校招笔试题 (1)垃圾邮件分类问题 1. 垃圾邮件分类特征? 2. 训练集中99%非垃圾、1%垃圾,训练模型视为100%非垃圾,准确率?召回率? 3. 在实际的应用场景中,尽可能地找回垃圾邮件,应该怎么办? ...

2018-03-20 14:16:05

阅读数 101

评论数 0

算法专题训练(3)回文字符串

516. Longest Palindromic Subsequence:求字符串中最大回文子串(不一定连续)的最大长度 将s翻转成s1 求s和s1的最长公共子序列长度 可以先判断下s是否是回文 另外一个思路 dp[i][j] = dp[i + 1][j - 1]...

2018-03-17 21:23:07

阅读数 86

评论数 0

八大排序算法

参考 理了一下八大排序(to do list好多年终于填掉了) 人是真的要锤大锤打才能成长起来哇~ 舍友过生日,先撤了~ # - * - coding:utf8 - * - - ''' @Author : Tinkle G @Creation Time: 2018/03/16 ''' c...

2018-03-16 20:46:15

阅读数 120

评论数 0

算法专题训练(2)小偷问题

198. House Robber:小偷不能偷相邻的房子,求最大收益 class Solution(object): def rob(self, nums): size = len(nums) if size == 0: return 0 ...

2018-03-13 21:00:26

阅读数 505

评论数 0

Leetcode 动态规划知识点总结

来看下Leetcode中Tag为Dynamic Programming的题目 股票买卖系列 小偷光顾房子系列 斐波那列序列及其变种 70. Climbing Stairs:爬山问题,Easy dp[i] = dp[i-1]+dp[i-2] 746. Min Cost Cl...

2018-03-13 20:42:53

阅读数 103

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭