从菜鸟做起呀~
码龄10年
求更新 关注
提问 私信
  • 博客:16,173
    社区:2
    16,175
    总访问量
  • 16
    原创
  • 6
    粉丝
  • 17
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:日本
加入CSDN时间: 2015-12-25

个人简介:先立个flag,一周有三四篇文章,对所看材料的整理

博客简介:

june1122的博客

查看详细资料
个人成就
  • 获得3次点赞
  • 内容获得3次评论
  • 获得23次收藏
  • 博客总排名287,007名
创作历程
  • 5篇
    2021年
  • 2篇
    2019年
  • 9篇
    2018年
  • 1篇
    2017年
成就勋章
TA的专栏
  • 面经
    1篇
  • 杂记
  • python库学习
    6篇
  • 业务相关知识整理
    4篇
  • leetcode-写着玩
    2篇

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 0

TA参与的活动 0

创作活动更多

新星杯·14天创作挑战营·第13期

这是一个以写作博客为目的的创作活动,旨在鼓励大学生博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。我们诚挚邀请你们参加为期14天的创作挑战赛!注: 1、参赛者可以进入活动群进行交流、互相鼓励与支持(开卷),虚竹哥会分享创作心得和涨粉心得,答疑及活动群请见:https://bbs.csdn.net/topics/619781944 【进活动群,得奖概率会更大,因为有辅导】 2、文章质量分查询:https://www.csdn.net/qc

90人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

102. Binary Tree Level Order Traversal

层次遍历,广度优先,用队列实现// 102.二叉树的层序遍历class Solution { public List<List<Integer>> resList = new ArrayList<List<Integer>>(); public List<List<Integer>> levelOrder(TreeNode root) { //checkFun01(root,0); .
原创
博文更新于 2021.11.24 ·
159 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

leetcode 459. Repeated Substring Pattern

代码简单 证明可以说是非常复杂了只需要计算next数组方法一 KMP (len - (next[len - 1] + 1)) 也就是: 12(字符串的长度) - 8(最长公共前后缀的长度) = 4, 4正好可以被 12(字符串的长度) 整除,所以说明有重复的子字符串(asdf)。方法二:因此我们可以考虑这种方法:我们将两个ss连在一起,并移除第一个和最后一个字符。如果ss是该字符串的子串,那么ss就满足题目要求。...
原创
博文更新于 2021.11.24 ·
254 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

leetcode 28 Implement strStr()

kmp算法 研究了两个午睡时间分两步走1.求needle的next数组next数组最难理解前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。然后找到这两个前缀后缀最长相同的部分2.从头遍历haystack// 方法一class Solution { public void getNext(int[] next, String s){ int j = -1; nex
原创
博文更新于 2021.11.23 ·
236 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

912 Sort an Array

1.快排 java用less more划分大于区 小于区 等于区,采用随机取数,时间复杂度class Solution { public int[] sortArray(int[] nums) { if (nums.length <= 1 ) { return nums; } quickSort(nums, 0, nums.length - 1); return nums; }
原创
博文更新于 2021.11.21 ·
631 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

剑指Offer05.替换空格

很多数组填充类的问题,都可以先预先给数组扩容带填充后的大小,然后在从后向前进行操作。不用申请新数组。 从后向前填充元素,避免了从前先后填充元素要来的 每次添加元素都要将添加元素之后的所有元素向后移动。//方式二:双指针法public String replaceSpace(String s) { if(s == null || s.length() == 0){ return s; } //扩充空间,空格数量2倍,和 String 类不同的是,Stri
原创
博文更新于 2021.11.20 ·
313 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

leetcode Add Two Numbers

两数相加方法一:利用python比较方便的包,转来转去,写了个效率比较低的# Definition for singly-linked list.# class ListNode(object):# def __init__(self, x):# self.val = x# self.next = Noneclass Solutio...
原创
博文更新于 2019.07.26 ·
126 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据处理中的Bug

慎用excel处理保存数据,会有数据类型转换 one-hot类型特征一定要注意是str还是int 若转换为float含有.0,导致特征名称不同
原创
博文更新于 2019.05.08 ·
208 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

工作总结-特征工程

连续两周做特征工程1、数据预处理,这是个相当麻烦的过程,尤其数据源给出的字段没有实际含义需要手动直接命名的时候。注意点:命名如果太多就别命了,血与泪的教训 处理json文件千万别把w写成r,同样是血与泪的教训 当返回值是list格式时,为了保存全部信息,首先要做one-hot,另外保留原始list的值(防止后边有人要补充特征) 在没有进行特征筛选前,能做的特征可以都做 Pyth...
原创
博文更新于 2018.12.10 ·
241 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

python中的时间格式

处理数据时经常会遇到处理时间的问题,拿原始数据中保存的str格式的日期筛选,结果不对python中有三种时间格式:1、时间戳(int,float类型),import time2、元组(struct_time类型)内涵九个元素 3、datetime类型(如:2017-11-28 14:49:43.097000)4、格式化的时间字符串 (String类型)最常用的形式是date...
原创
博文更新于 2018.10.31 ·
3916 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

评估三方数据时遇到的一些代码和模型上的问题

1、特征名称编码问题,特别是有中文的时候,容易遇到utf-8和unicode编码不能比较的问题在目前python2的环境下,先对所有先运行var.encode(encoding),若本来是unicode编码会报错,可以先判断计算机内存中,统一使用Unicode编码,需要保存或者传输时,转换成UTF8编码 而 Python2 默认编码是 ASCII编码。然而,众所周知,在需要需要转换的场景...
原创
博文更新于 2018.10.25 ·
281 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

每日整理---模型监控方法以及评分卡模型

模型监控以及参数怎么使用模型的监控主要是要看在线上的模型评分是否稳定,但是当参数说明模型评分有变化时,具体是进件整体的变化,还是某个特征源的变化并不能知道。所以要更改阈值,还是重训模型,还是不做改变,还需要具体问题具体分析。具体调研两种参数K-L相对熵是目前打分对于标准分布的偏差(有做校准,将校准分布作为标准分布)需要注意的是kl相对熵不满足距离参数中对称的特征,所以KL相对熵...
原创
博文更新于 2018.10.23 ·
4539 阅读 ·
1 点赞 ·
1 评论 ·
12 收藏

scikit-learn中如何保存模型

作者:我是马夫链接:https://www.zhihu.com/question/27187105/answer/97334347来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。Scikit-learn 官网上建议的两种方式:1. pickle&gt;&gt;&gt; from sklearn import svm&gt;&gt;&gt; from sklearn ...
转载
博文更新于 2018.04.11 ·
1102 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

sklearn

概率校准:概率校准就是对分类函数做出的分类预测概率重新进行计算,并且计算Brier分数,然后依据Brier分数的大小判断对初始预测结果是支持还是反对。sklearn 中的 CalibratedClassifierCV...
原创
博文更新于 2018.04.10 ·
213 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python-numpy

import numpy as np用过的命令总结:1、np.random.random(n)随机产生n个0-1之间的浮点数。random用法很多,可用到啥查啥
原创
博文更新于 2018.04.10 ·
141 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

机器学习训练集测试集划分-按比例抽取,交叉检验?

1.打乱数据 shuffle我们有下面以个DataFrame我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变。方法1:sample  df.sample(frac=1) 这样对可以对df进行shuffle。其中参数frac是要返回的比例,比如df中有10行数据,我只想返回其中的30%,那么frac=0.3...
原创
博文更新于 2018.03.06 ·
2306 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

pandas文件读取

最近重新系统的学一下python的库,尝试写一些笔记。df = pd.read_table('test.tsv', sep='\t', encoding='utf-8')也可以用read_csv语句,sep表明分隔符类型,默认是','。如果只取部分列,可以跟sql语句中一样:unames = ['a','b','c']df = pd.read_table('test.tsv
原创
博文更新于 2018.02.03 ·
289 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

一个不专业的校招总结

第一次写博客,之前其实也有些的念头,每次都觉得自己不够专业就打消了。这次来写校招之旅,碎碎念一波。漫长的秋招之旅,还不是因为自己菜运气还不好经过这次秋招,对自己的评价就是傻乎乎,但也跟室友讲,经过了这次我们就能快速成长了啊。本人是电子与通信工程专业的小硕,秋招投的主要方向是数据挖掘。
原创
博文更新于 2017.12.14 ·
1214 阅读 ·
1 点赞 ·
1 评论 ·
6 收藏
加载更多