自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 102. Binary Tree Level Order Traversal

层次遍历,广度优先,用队列实现// 102.二叉树的层序遍历class Solution { public List<List<Integer>> resList = new ArrayList<List<Integer>>(); public List<List<Integer>> levelOrder(TreeNode root) { //checkFun01(root,0); .

2021-11-24 23:56:30 171

原创 leetcode 459. Repeated Substring Pattern

代码简单 证明可以说是非常复杂了只需要计算next数组方法一 KMP (len - (next[len - 1] + 1)) 也就是: 12(字符串的长度) - 8(最长公共前后缀的长度) = 4, 4正好可以被 12(字符串的长度) 整除,所以说明有重复的子字符串(asdf)。方法二:因此我们可以考虑这种方法:我们将两个ss连在一起,并移除第一个和最后一个字符。如果ss是该字符串的子串,那么ss就满足题目要求。...

2021-11-24 13:10:19 263

原创 leetcode 28 Implement strStr()

kmp算法 研究了两个午睡时间分两步走1.求needle的next数组next数组最难理解前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。然后找到这两个前缀后缀最长相同的部分2.从头遍历haystack// 方法一class Solution { public void getNext(int[] next, String s){ int j = -1; nex

2021-11-23 14:44:41 252

原创 912 Sort an Array

1.快排 java用less more划分大于区 小于区 等于区,采用随机取数,时间复杂度class Solution { public int[] sortArray(int[] nums) { if (nums.length <= 1 ) { return nums; } quickSort(nums, 0, nums.length - 1); return nums; }

2021-11-21 19:30:44 642

原创 剑指Offer05.替换空格

很多数组填充类的问题,都可以先预先给数组扩容带填充后的大小,然后在从后向前进行操作。不用申请新数组。 从后向前填充元素,避免了从前先后填充元素要来的 每次添加元素都要将添加元素之后的所有元素向后移动。//方式二:双指针法public String replaceSpace(String s) { if(s == null || s.length() == 0){ return s; } //扩充空间,空格数量2倍,和 String 类不同的是,Stri

2021-11-20 13:26:07 325

原创 leetcode Add Two Numbers

两数相加方法一:利用python比较方便的包,转来转去,写了个效率比较低的# Definition for singly-linked list.# class ListNode(object):# def __init__(self, x):# self.val = x# self.next = Noneclass Solutio...

2019-07-26 00:25:59 138

原创 数据处理中的Bug

慎用excel处理保存数据,会有数据类型转换 one-hot类型特征一定要注意是str还是int 若转换为float含有.0,导致特征名称不同

2019-05-08 19:31:51 220

原创 工作总结-特征工程

连续两周做特征工程1、数据预处理,这是个相当麻烦的过程,尤其数据源给出的字段没有实际含义需要手动直接命名的时候。注意点:命名如果太多就别命了,血与泪的教训 处理json文件千万别把w写成r,同样是血与泪的教训 当返回值是list格式时,为了保存全部信息,首先要做one-hot,另外保留原始list的值(防止后边有人要补充特征) 在没有进行特征筛选前,能做的特征可以都做 Pyth...

2018-11-21 18:51:56 251

原创 python中的时间格式

处理数据时经常会遇到处理时间的问题,拿原始数据中保存的str格式的日期筛选,结果不对python中有三种时间格式:1、时间戳(int,float类型),import time2、元组(struct_time类型)内涵九个元素 3、datetime类型(如:2017-11-28 14:49:43.097000)4、格式化的时间字符串 (String类型)最常用的形式是date...

2018-10-31 14:25:55 3930

原创 评估三方数据时遇到的一些代码和模型上的问题

1、特征名称编码问题,特别是有中文的时候,容易遇到utf-8和unicode编码不能比较的问题在目前python2的环境下,先对所有先运行var.encode(encoding),若本来是unicode编码会报错,可以先判断计算机内存中,统一使用Unicode编码,需要保存或者传输时,转换成UTF8编码 而 Python2 默认编码是 ASCII编码。然而,众所周知,在需要需要转换的场景...

2018-10-24 20:17:24 293

原创 每日整理---模型监控方法以及评分卡模型

模型监控以及参数怎么使用模型的监控主要是要看在线上的模型评分是否稳定,但是当参数说明模型评分有变化时,具体是进件整体的变化,还是某个特征源的变化并不能知道。所以要更改阈值,还是重训模型,还是不做改变,还需要具体问题具体分析。具体调研两种参数K-L相对熵是目前打分对于标准分布的偏差(有做校准,将校准分布作为标准分布)需要注意的是kl相对熵不满足距离参数中对称的特征,所以KL相对熵...

2018-10-23 11:10:27 4597 1

转载 scikit-learn中如何保存模型

作者:我是马夫链接:https://www.zhihu.com/question/27187105/answer/97334347来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。Scikit-learn 官网上建议的两种方式:1. pickle&gt;&gt;&gt; from sklearn import svm&gt;&gt;&gt; from sklearn ...

2018-04-11 16:22:57 1116

原创 sklearn

概率校准:概率校准就是对分类函数做出的分类预测概率重新进行计算,并且计算Brier分数,然后依据Brier分数的大小判断对初始预测结果是支持还是反对。sklearn 中的 CalibratedClassifierCV...

2018-04-10 17:25:32 269

原创 python-numpy

import numpy as np用过的命令总结:1、np.random.random(n)随机产生n个0-1之间的浮点数。random用法很多,可用到啥查啥

2018-04-10 14:55:26 151

原创 机器学习训练集测试集划分-按比例抽取,交叉检验?

1.打乱数据 shuffle我们有下面以个DataFrame我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变。方法1:sample  df.sample(frac=1) 这样对可以对df进行shuffle。其中参数frac是要返回的比例,比如df中有10行数据,我只想返回其中的30%,那么frac=0.3...

2018-03-06 15:41:08 2333

原创 pandas文件读取

最近重新系统的学一下python的库,尝试写一些笔记。df = pd.read_table('test.tsv', sep='\t', encoding='utf-8')也可以用read_csv语句,sep表明分隔符类型,默认是','。如果只取部分列,可以跟sql语句中一样:unames = ['a','b','c']df = pd.read_table('test.tsv

2018-02-03 20:16:07 299

原创 一个不专业的校招总结

第一次写博客,之前其实也有些的念头,每次都觉得自己不够专业就打消了。这次来写校招之旅,碎碎念一波。漫长的秋招之旅,还不是因为自己菜运气还不好经过这次秋招,对自己的评价就是傻乎乎,但也跟室友讲,经过了这次我们就能快速成长了啊。本人是电子与通信工程专业的小硕,秋招投的主要方向是数据挖掘。

2017-12-10 21:10:27 1232 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除