自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)

原创 XGBoost模型

1.模型 (1)整体模型函数如下: 其中 k 表示树的数量,f 表示每棵树的预测函数; (2)截取到第 t 棵树的模型函数表示如下: 2.训练 (1)每次训练一棵树,目标函数如下:     其中第一项是损失函数,第二项是防止过拟合;N表示样本数,T表示所有树的叶子数目,t 表示训练第 t 棵树,w 表示叶子的输出值; (2)泰勒展开(二阶展开):

2016-04-28 20:33:37 5511

原创 正则表达式

(一)简介 1.正则表达式描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等; 2.正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式;模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配; (二)常见字符定义: 1.非打印字

2016-04-27 10:53:16 525

原创 基于Python的网络爬虫入门

1.网页抓取入门 (1)简单的抓取:直接从url抓网页数据 (2)传递数据:post或者get方式 post: 3 4 5 6 7 8 9 import urllib import urllib2   values = {"username":"1

2016-04-21 12:57:13 1318

原创 awk笔记

(一)简介 1.awk是一种处理文本文件的语言,是一个强大的文本分析工具。 2.常见用法 log.txt 2 this is a test 3 Are you like awk This's a test 10 There are orange,apple,mongo (1)用法一: awk '{[pattern] action}' {filenames} # '' 只能用单引

2016-04-20 20:28:51 545

原创 shell笔记

(一)简介 1.Shell有两种执行命令的方式: 交互式(Interactive):解释执行用户的命令,用户输入一条命令,Shell就解释执行一条。批处理(Batch):用户事先写一个Shell脚本(Script),其中有很多条命令,让Shell一次把这些命令执行完,而不必一条一条地敲命令。 2.一个简单的例子 #!/bin/bash echo "What is your name?"

2016-04-20 17:43:59 736

空空如也

空空如也

空空如也
提示
确定要删除当前文章?
取消 删除