自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 【JAVA】log4j使用

1. 日志级别是一个很重要的概念,高级别的日志会在低级别的日志中记录,反之则不会。例如error级别的日志,一定会经过debug级别(通常是控制台输出)以及info级别(通常是log文件记录)的处理,但它会有自己专门error级别的处理(通常是error文件记录)。所以最近我碰到的日志记录方法里,前人只配置了info级别的日志记录方式,所以error日志与info日志是打在一起的。这种方式...

2019-11-18 19:28:55 184

原创 【分支管理】Git

首先明确两个概念。分支:分支的本质是指向commit对象(每个版本库就是commit对象)的可变指针,可以有若干分支,也即可以创建若干指针;Head:Head是一个特别指针,指向你正在工作的本地分支,有了Head指针Git才知道你当前在哪个分支上工作;1. git branch列出所有分支,并且用*标明当前所在分支;2. git brach <nam...

2019-08-25 12:09:28 167

原创 【远程仓库】Git

1. SSH密钥对公钥上传到Git服务器上,也就是Github或者公司的Git版本服务器;私钥自己保存,Windows下的路径在User中。使用SSH协议加密是因为Git服务器需要识别出该版本推送确实是你推送的,而不是别人冒充的。2. 关联一个远程库(但是关联远程库用的很少)在想要关联到远程库的库文件夹中,执行Git Bash: git remote add <shortn...

2019-08-18 21:48:47 143

原创 【入门】Git基础

1. 安装完成后的git config因为Git是分布式版本控制系统,所以每个机器都必须自报家门:你的名字和Email地址。名字和email应该是显示在版本树历史中的那个。注意git config命令的--global参数,用了这个参数,表示你这台机器上所有的Git仓库都会使用这个配置。2. 初始化一个Git仓库在GIT Bash进入到该文件夹之后,使用git init命令,...

2019-08-18 16:39:30 203

原创 【Linux】硬盘分区、挂载、以及安装

1.MBR格式主分区:一块硬盘上最多有4个主分区,其中只有1个可以被标记为活动分区(存放引导系统启动的文件)。在Linux中,主分区的序号范围是1-4。扩展分区:可以选取主分区中的一个为扩展分区,扩展分区支持自身切盘为更小的分区。逻辑分区:从扩展分区中切盘得到的分区。2.挂载Windows系统中,C,D,E的盘符只是分区的访问路径而已,我们可以删掉盘符,然后把分区挂载到文...

2019-07-09 17:31:03 179

原创 【运维】服务器硬件基本知识

1.服务器按应用功能分WEB服务器(例如Apache),数据库服务器(例如Mysql),文件服务器(例如FTP),版本控制服务器(例如Git),域控制服务器(例如DC)等等类型2.实体的服务器样式外表:刀片式和机架式比较主流,塔式已经濒临淘汰了;内部:单个服务器的也就像主机一样,有CPU 主板 内存 硬盘 网卡这些内容,只是品质高且方便拆卸;3.服务器操作系统C...

2019-07-07 17:36:11 3994

原创 【运维】N进制的熟悉

N进制的本质就是逢N进一位,进一位具体指的是“增加位数”。1.二进制对照十进制0,1,2,3,4,5,6,7,8,9,10...0,1,10,11,100,101,110,111,1000,1001,1010...记住二进制与十进制的常用转换,可以在做进制转换时由这些基础数字做加减法得来:1 110 2100 41000 81010 1010000 161...

2019-07-07 15:39:42 695

原创 【Python】编程思维总结

1.规则化思维今天遇到一个画七段数码管的问题,初看画每一个阿拉伯数字的过程都是不同的,很麻烦。但是细看,可以发现,画每个数字的过程都可以看作把七段数码管全部“走一遍”的过程,只是针对不同数字,某一段数码管需要设定显形或隐形而已。同时,如果选择中部为起笔点,那么每一次运笔过程都是向右转90度,这就有规律可循。对一个实际问题与它的许多个case,一定要找到底层的一般性规律,只有找到这个规律了编...

2019-06-01 11:53:04 1248

原创 【Python】coding tips

1.for循环中使用的计数器一般在循环体内部的第一行就把计数器更新,因为循环体内很可能会用到该变量,要保证它在这一轮循环之前就被更新了。2.写分支结构一定要注意是否需要严谨的二分支,即是否需要加上else语句。很容易没想清楚处理过程而忘记用完整二分支结构,导致应该是分支处理的两种情况,变成了不该进入后面分支的用例也进入其中被处理。3.flag的使用有某些情况,在跳出...

2019-05-22 11:30:56 211

原创 【Python】Python IDE总结

之前写Python一直用的是Pycharm,结果导致去面试的时候,连怎么用Python原生的IDE都不知道很影响发挥。所以小小总结一下目前的IDE情况。IDLE:安装python时就自带的极简开发环境,可以有交互式和文件式两种编写方法。 Spider:Anaconda自带的标准开发环境,同一个界面上就有交互式和文件式两种编写方法,做小型项目完全足够且便捷。 Pycharm:目前最综合性的开...

2019-05-20 17:43:20 202

原创 【Python】eval函数

eval()函数的官方解释是用来执行一个字符串表达式,并返回表达式的值。说直接点就是,可以把拥有特定属性的字符串,直接给转换成Python中的某种数据类型,或者直接计算该字符串所代表的算式。这是个非常便捷的函数,下面是例子:a = "[[1,2], [3,4], [5,6], [7,8], [9,0]]"print(type(eval(a)))b = "3*2"print(eva...

2019-05-20 17:05:55 2840

原创 【机器学习】天池O2O优惠券使用预测_系统性总结与心得

Preface:上半年参加天池的O2O优惠券预测赛排名第二,同时参加了学校数据仓库老师的课程改革建设团队,于是把参赛经验总结成文,准备分享给该课程的学弟学妹。现在我把总结的参赛教程文章也发到CSDN上来,供参赛的同学们参考,也希望能得到更多的指教。1 赛题背景1.1 题目介绍比赛背景:赛题的发布网址如下:https://tianchi.aliyun.com/competition...

2018-10-29 17:24:35 5378 4

原创 【机器学习】集成学习笔记

1. 基础知识概念:集成学习(ensemble learning)先产生出一组“个体学习器”,再用某种策略将它们结合起来。这些个体学习器可以类型相同,也可以不同。 集成学习通过将多个学习器进行集合,常可获得比单一学习器显著优越的泛化性能,但有一个小条件——这些个体学习器至少不差于弱学习器(泛化性能略优于50%的学习器)。这次融合我的XGBOOST和Andy的GBDT结果集得到了非常好的提升效...

2018-08-08 15:48:46 487

原创 【机器学习】各种树算法的总结

这个总结主要为XGboost而写,而Boosting方法是集成学习的一种,所以在最开始有必要记录一下集成学习的概念。集成学习的目的是通过结合多个基学习器的预测结果来改善单个学习器的泛化能力和鲁棒性。目前的集成学习方法大致分为两大类:即个体学习器之间存在强依赖关系、必须串行生成的序列化方法,代表就是Boosting;以及个体学习器间不存在强依赖关系、可同时生成的并行化方法,代表是Bagging和...

2018-07-31 10:55:05 1258

原创 【机器学习】apply的使用总结

apply可以用在dataframe的某一列上,例如imdb['runtime'] = imdb.runtime.apply(lambda x:x[0:-6]),此时apply()内不需要加axis=1 apply可以用在整个dataframe上,此时x是一整行,而可以用['xxx']的方法调用行的某一列,但注意必须给出参数axis=1...

2018-04-25 10:30:36 1014

原创 【机器学习】Pandas Merge后出现大量NaN值

今天在merge天池的数据表时,用coupon_id作为键值却发现合并后产生不应该有的NA值。原因是:待merge的两个表中的coupon_id,dtype类型不同,造成python以为两个表没有共同键值,于是产生大量NaN。...

2017-12-12 17:00:05 10261 1

原创 【机器学习】Pandas drop_duplicates的inplace属性

1.off = off.drop_duplicates()2.off.drop_duplicates(inplace=True)1和2才是等价的,如果单独写一个off.drop_duplicates(),没有inplace属性,那么并不会更改内存中的off数据集。表现出来就好像drop_duplicates()方法没有用。一个坑,特此记下。...

2017-12-08 22:37:20 1710

转载 【数据库】关于char,varchar等SQLS中的数据类型

1) 定义:char: 固定长度,存储ANSI字符,不足的补英文半角空格。nchar: 固定长度,存储Unicode字符,不足的补英文半角空格varchar: 可变长度,存储ANSI字符,根据数据长度自动变化。nvarchar: 可变长度,存储Unicode字符,根据数据长度自动变化。nvarchar(n) :包含 n个字符的可变长度 Unicod...

2017-10-25 16:56:57 830

转载 【机器学习】ROC曲线

1.概述  AUC(Area Under roc Curve)是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度;在信息检索(IR)领域中常用的recall和precision,等等。其实,度量反应了人们对”好”的分类结果的追求,同一时期的不同的度量反映了人们对什么是”好”这个最根本问题的不同认识,而不...

2017-10-07 18:13:29 3385

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除