- 博客(16)
- 资源 (2)
- 收藏
- 关注
原创 个人机器学习路径规划
第一阶段:机器学习入门1、小象学院机器学习视频24课—中科院邹博2、网易公开课斯坦福机器学习视频20课—吴恩达http://open.163.com/special/opencourse/machinelearning.htmlCS229课程讲义北航张雨石CSDN博客,http://blog.csdn.net/column/details/ml-ng-record.html海大黄海广博士笔记,
2017-10-30 13:35:25 5577 2
原创 LightGBM算法总结
1 LightGBM原理1.1 GBDT和 LightGBM对比 GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。GBDT 在工业界应用广泛,通常被用于点击率预测,搜索排序等任务。GBDT 也是各种数据挖掘竞赛的致命武器...
2018-08-21 18:39:47 98512 24
转载 python正则表达式
1 简介正则表达式本身是一种小型的、高度专业化的编程语言,而在python中,通过内嵌集成re模块,可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。 2 正则表达式常用字符2.1 普通字符和11个元字符 普通 字符 匹配自身 abc abc . 匹配任意除换行符”\n”外的字符(在DOTAL...
2018-08-03 09:21:04 448
原创 机器学习之决策树分类算法(ID3 and C4.5)
1 决策树算法框架1.1 决策树主函数决策树主函数本质是一个递归函数,主要功能是按照某种规则生长出决策树的各个分支节点,并根据终止条件结束算法。 主函数功能: (1)输入分类的数据集和类别标签。 (2)根据某种分类规则得到最优的划分特征,并创建特征的划分节点——计算最优特征子函数。 (3)按照该特征取值划分数据集为若干部分——划分数据集子函数。 (4
2017-11-07 17:23:35 1480
原创 python基本操作总结(三)
1 泰勒(Taylor)展开式 e^x泰勒展开式代码如下:#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport mathimport matplotlib as mplimport matplotlib.pyplot as pltdef calc_e_small(x): n = 10 f = np
2017-11-01 13:40:55 1038
原创 python基本操作总结(二)
1 基本绘图1.1 绘制正态分布概率密度函数mu = 0 #均值sigma = 1 #标准差x = np.linspace(mu - 3 * sigma, mu + 3 * sigma, 50)#概率密度函数y = np.exp(-(x - mu) ** 2 / (2 * sigma ** 2)) / (math.sqrt(2 * math.pi) * sigma)print x.sha
2017-11-01 11:32:27 2103
原创 python基本操作总结(一)
1.引入需要的包#!/usr/bin/python #linux上使用命令# -*- coding:utf-8 -*- #修改编码格式# 导入NumPy函数库,一般都是用这样的形式(包括别名np,几乎是约定俗成的)import numpy as npimport matplotlibfrom mpl_toolkits.mplot3d import Axes3Dfrom matplotlib
2017-10-31 21:13:21 519
原创 机器学习基础04-凸优化
由于机器学习基础知识部分多为数学理论,公式较多,markdown编辑公式不便,因此转为图片格式,后期机器学习代码部分会写成文档格式。
2017-10-30 14:17:45 434
原创 机器学习基础03-矩阵和线性代数
由于机器学习基础知识部分多为数学理论,公式较多,markdown编辑公式不便,因此转为图片格式,后期机器学习代码部分会写成文档格式。
2017-10-30 14:06:31 433
原创 机器学习基础02-数理统计与参数估计
由于机器学习基础知识部分多为数学理论,公式较多,markdown编辑公式不便,因此转为图片格式,后期机器学习代码部分会写成文档格式。
2017-10-30 08:31:14 386
原创 机器学习基础01-数学分析与概率论
由于机器学习基础知识部分多为数学理论,公式较多,markdown编辑公式不便,因此转为图片格式,后期机器学习代码部分会写成文档格式。
2017-10-25 20:44:39 367
原创 Mybatis操作数据库实现单表/多表查询流程
1 创建web工程步骤1.1 创建数据库及数据库表通过sqlyog可视化工具,导入外部sql或直接创建1.2 新建maven下war project1.3 新建WEB_INF文件夹下web.xml文件并补全其中参数<?xml version="1.0" encoding="UTF-8"?><web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-in
2017-10-10 21:05:15 1804
原创 SpringMVC+Spring+Mybatis三大框架的整合流程(基于maven工程)
一、需求分析需求:实现从数据库中查询商品列表展示到页面上。 开发环境:基于srpingMVC 4.2.4 + spring 4.2.4+ mybatis 3.2.7+maven整合开发我们的商品列表页面和商品编辑页面。二、实现步骤第一步:创建maven项目 第二步:解决jdk版本过低问题以及web.xml丢失问题 (1)在pom.xml里配置jdk版本依赖 <build> <pl
2017-10-10 20:28:32 349
原创 机器学习之kNN分类算法
一.概述k-近邻算法采用测量不同特征值的方法信息分类。模型三个基本要素为:距离度量、k值选择和分类决策规则。 (1)距离度量:常用“欧式距离”表示两n维实数向量之间的距离。 (2)k值一般选取比较小的数值,通常采用交叉验证法来选取最优k值。 (3)k近邻模型的分类决策规则通常为多数表决规则,即由输入实例的k个临近的训练实例中的多数类决定输入实例的类。k个训练实例点组成的集合为Nk (x)。
2017-10-10 19:36:29 1252
原创 Hadoop权威指南(第三版)学习笔记之一初识Hadoop
第1章 初识Hadoop1.1 数据!数据!大数据1ZB=1000EB=10^6^PB=10^9^TB=10^21^ 字节,相当于世界上每个人一个硬盘驱动器所能容纳数据的数量级。推荐系统中“大量数据胜于好的算法”。1.2 数据存储与分析1TB硬盘,按其传输熟读约为100MB/s来算,读取整个硬盘数据需要约2.5h,但是将相同内容存放在100个硬盘中,每个存储1%,并行读取,用时不超过2min。实际情
2017-10-10 18:26:06 762
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人