自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (2)
  • 收藏
  • 关注

原创 个人机器学习路径规划

第一阶段:机器学习入门1、小象学院机器学习视频24课—中科院邹博2、网易公开课斯坦福机器学习视频20课—吴恩达http://open.163.com/special/opencourse/machinelearning.htmlCS229课程讲义北航张雨石CSDN博客,http://blog.csdn.net/column/details/ml-ng-record.html海大黄海广博士笔记,

2017-10-30 13:35:25 5542 2

原创 LightGBM算法总结

1 LightGBM原理1.1 GBDT和 LightGBM对比​ GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。GBDT 在工业界应用广泛,通常被用于点击率预测,搜索排序等任务。GBDT 也是各种数据挖掘竞赛的致命武器...

2018-08-21 18:39:47 94858 24

转载 python正则表达式

1 简介正则表达式本身是一种小型的、高度专业化的编程语言,而在python中,通过内嵌集成re模块,可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。 2 正则表达式常用字符2.1 普通字符和11个元字符 普通 字符 匹配自身 abc abc . 匹配任意除换行符”\n”外的字符(在DOTAL...

2018-08-03 09:21:04 433

原创 机器学习之决策树分类算法(ID3 and C4.5)

1 决策树算法框架1.1 决策树主函数决策树主函数本质是一个递归函数,主要功能是按照某种规则生长出决策树的各个分支节点,并根据终止条件结束算法。 主函数功能: (1)输入分类的数据集和类别标签。 (2)根据某种分类规则得到最优的划分特征,并创建特征的划分节点——计算最优特征子函数。 (3)按照该特征取值划分数据集为若干部分——划分数据集子函数。 (4

2017-11-07 17:23:35 1466

原创 python基本操作总结(三)

1 泰勒(Taylor)展开式 e^x泰勒展开式代码如下:#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport mathimport matplotlib as mplimport matplotlib.pyplot as pltdef calc_e_small(x): n = 10 f = np

2017-11-01 13:40:55 1009

原创 python基本操作总结(二)

1 基本绘图1.1 绘制正态分布概率密度函数mu = 0 #均值sigma = 1 #标准差x = np.linspace(mu - 3 * sigma, mu + 3 * sigma, 50)#概率密度函数y = np.exp(-(x - mu) ** 2 / (2 * sigma ** 2)) / (math.sqrt(2 * math.pi) * sigma)print x.sha

2017-11-01 11:32:27 2058

原创 python基本操作总结(一)

1.引入需要的包#!/usr/bin/python #linux上使用命令# -*- coding:utf-8 -*- #修改编码格式# 导入NumPy函数库,一般都是用这样的形式(包括别名np,几乎是约定俗成的)import numpy as npimport matplotlibfrom mpl_toolkits.mplot3d import Axes3Dfrom matplotlib

2017-10-31 21:13:21 494

原创 机器学习基础04-凸优化

由于机器学习基础知识部分多为数学理论,公式较多,markdown编辑公式不便,因此转为图片格式,后期机器学习代码部分会写成文档格式。

2017-10-30 14:17:45 421

原创 机器学习基础03-矩阵和线性代数

由于机器学习基础知识部分多为数学理论,公式较多,markdown编辑公式不便,因此转为图片格式,后期机器学习代码部分会写成文档格式。

2017-10-30 14:06:31 426

原创 机器学习基础02-数理统计与参数估计

由于机器学习基础知识部分多为数学理论,公式较多,markdown编辑公式不便,因此转为图片格式,后期机器学习代码部分会写成文档格式。

2017-10-30 08:31:14 378

原创 机器学习基础01-数学分析与概率论

由于机器学习基础知识部分多为数学理论,公式较多,markdown编辑公式不便,因此转为图片格式,后期机器学习代码部分会写成文档格式。

2017-10-25 20:44:39 355

原创 Mybatis操作数据库实现单表/多表查询流程

1 创建web工程步骤1.1 创建数据库及数据库表通过sqlyog可视化工具,导入外部sql或直接创建1.2 新建maven下war project1.3 新建WEB_INF文件夹下web.xml文件并补全其中参数<?xml version="1.0" encoding="UTF-8"?><web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-in

2017-10-10 21:05:15 1794

原创 SpringMVC+Spring+Mybatis三大框架的整合流程(基于maven工程)

一、需求分析需求:实现从数据库中查询商品列表展示到页面上。 开发环境:基于srpingMVC 4.2.4 + spring 4.2.4+ mybatis 3.2.7+maven整合开发我们的商品列表页面和商品编辑页面。二、实现步骤第一步:创建maven项目 第二步:解决jdk版本过低问题以及web.xml丢失问题 (1)在pom.xml里配置jdk版本依赖 <build> <pl

2017-10-10 20:28:32 341

原创 机器学习之朴素贝叶斯分类算法

注:由于数学公式太多,为方便编写转为图片格式阅读。

2017-10-10 19:44:51 262

原创 机器学习之kNN分类算法

一.概述k-近邻算法采用测量不同特征值的方法信息分类。模型三个基本要素为:距离度量、k值选择和分类决策规则。 (1)距离度量:常用“欧式距离”表示两n维实数向量之间的距离。 (2)k值一般选取比较小的数值,通常采用交叉验证法来选取最优k值。 (3)k近邻模型的分类决策规则通常为多数表决规则,即由输入实例的k个临近的训练实例中的多数类决定输入实例的类。k个训练实例点组成的集合为Nk (x)。

2017-10-10 19:36:29 1239

原创 Hadoop权威指南(第三版)学习笔记之一初识Hadoop

第1章 初识Hadoop1.1 数据!数据!大数据1ZB=1000EB=10^6^PB=10^9^TB=10^21^ 字节,相当于世界上每个人一个硬盘驱动器所能容纳数据的数量级。推荐系统中“大量数据胜于好的算法”。1.2 数据存储与分析1TB硬盘,按其传输熟读约为100MB/s来算,读取整个硬盘数据需要约2.5h,但是将相同内容存放在100个硬盘中,每个存储1%,并行读取,用时不超过2min。实际情

2017-10-10 18:26:06 734

大数据基础入门-实战Hadop:开启通向云计算的捷径.刘鹏.

大数据云计算基础入门书籍

2017-08-17

机器学习数学基础经典书籍-李航《统计学习方法》

大神推荐之机器学习入门书籍,主要为数学基础。

2017-08-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除