自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (3)
  • 收藏
  • 关注

原创 SQL专题1

SQL专题1一、牛客SQL题11、查找最晚入职员工的所有信息2、查找入职员工时间排名倒数第三的员工所有信息3、查找当前薪水详情以及部门编号dept_no4、查找所有已经分配部门的员工的last_name和first_name5、查找所有员工的last_name和first_name以及对应部门编号dept_no6、查找所有员工入职时候的薪水情况7、查找薪水涨幅超过15次的员工号emp_no以及其对...

2019-09-07 22:06:25 251

原创 Python数据结构与算法

1、栈结构的实现class Stack(object): """栈操作""" def __init__(self): self.__list = [] def push(self,item): """ 添加一个新元素item到栈顶 :param item: :return: ...

2019-08-16 13:57:27 179

原创 Python算法day02

Python算法之递归一、递归1.1 累加改为递归1.2 递归三定律参考链接一、递归1.1 累加改为递归def listsum(numList): theSum = 0 for i in numList: theSum = theSum + i return theSumprint(listsum([1,3,5,7,9]))def sumnum...

2019-08-14 23:20:56 249

原创 Python算法

Python算法一、二分查找1.1 普通的二分查找1.2 带旋转数组的二分查找1.3 搜索旋转排序数组二、顺序查找三、排序算法3.1 冒泡排序3.1 选择排序3.3 插入排序3.4 快速排序3.5 归并排序3.6 希尔排序参考链接一、二分查找时间复杂度 O(logN)1.1 普通的二分查找python算法图解中的解释通过不断迭代mid的值,来查找参数def binary...

2019-08-13 19:14:39 1024

原创 深度学习day01【李宏毅】

深度学习day01一、梯度下降法1.1 Adagrad1.2 Stochastic Gradient Descent1.3 Feature Scaling二、Logitstic Regression2.1 Logistic Regression为什么不用平方误差2.2 Softmax2.3 Limitation of Logistic Regression三、Deep Learning一、梯度下...

2019-08-03 11:49:08 146

转载 聚类算法专题

聚类算法)一、聚类算法简介二、K-means算法2.1 算法原理2.2 K-means算法流程2.3 算法原理2.4 K-means算法总结2.5 K-means算法案例三、算法效果衡量标准3.1 SSE值:误差平方和3.2 K值确定3.3 轮廓系数法(Silhouette Coefficient)3.4 Calinski-Harabasz Index(CH系数)3.5 总结3.5.1 肘部法3....

2019-07-28 20:34:50 1103

原创 集成学习

集成学习一、集成学习的简单实现1.1 导入数据1.2 分割数据1.3 逻辑回归训练1.4 SVM 训练1.5 决策树训练1.6 简单集成1.7 使用voting classifier二、Soft Voting三、集成学习3.1 Bagging3.2 OOB3.3 n_jobs3.4 Bootstrap_features四、随机森林五、Extra-Trees【极其随机树】六、Ada Boosting...

2019-07-18 16:43:46 428

原创 决策树【补充】

决策树一、代码实现二、什么是决策树2.1 如何去构建决策树?三、信息熵3.1 二类信息熵绘制四、基尼系数五、CART5.1 导入数据集5.2 导入决策树算法,进行训练数据5.3 绘制决策边界,不限制其参数5.4 生成的决策树最大深度为2 max_depth=25.5 最小样本分割点【样本至少有10个才分割】 min_samples_split=105.6 叶子节点至少为65.7 最多四个叶子节点六...

2019-07-18 14:56:01 865

原创 支持向量机(SVM)

支持向量机 Support Vector Machine一、什么是支持向量机二、Max(margin)三、Soft Margin SVM四、实际使用SVM4.1 导入相关模块和数据集4.2 绘制原始数据散点图4.3 对数据进行标准化处理4.4 C = 1e9 训练模型4.5 绘制决策边界4.6 C=0.014.7 绘制Soft Margin SVM 决策边界4.7.1 C=1e94.7.2 C=0...

2019-07-18 13:12:21 758

原创 评价分类结果

评价分类结果一、混淆矩阵 Confusion Matrix1.1 精准率1.2 召回率二、混淆矩阵的实现2.1 TN2.2 FP2.3 FN2.4 TP2.5 混淆矩阵2.6 精确率 precision_score2.7 召回率2.8 scikit-learn中的confusion_matrix三、F1 score四、Precision-Recall之间的平衡五、ROC曲线六、多分类中的ROC曲线...

2019-07-17 16:52:52 927

原创 逻辑回归

逻辑回归一、什么是逻辑回归?二、决策边界三、多项式中的逻辑回归四、逻辑回归中使用正则化一、什么是逻辑回归?逻辑回归假设样本服从伯努利分布,利用极大似然估计,运用梯度下降法进行求解,从而达到将样本二分类的目的。求导得minJ(θ)import numpy as npimport matplotlib.pyplot as pltdef sigmoid(...

2019-07-17 13:50:14 330 1

原创 多项式回归与泛化

多项式与泛化)一、多项式回归二、关于PolynomialFeatures三、Pipeline【管道?】四、过拟合和欠拟合4.1 原始数据集4.2 使用线性回归训练数据4.3 使用多项式回归五、train_test_split六、学习曲线七、验证数据集和交叉验证(Cross Validation)7.1使用交叉验证7.2 网格搜索7.3 留一法 LOO-CV八、偏差与方差九、模型正则化9.1 岭回归...

2019-07-16 20:04:11 531

原创 Python中进制问题

Python中进制问题一、各个进制问题概览1.1 二进制1.2 八进制1.3 十六进制1.4 十进制二、进制间转换2.1 十进制转化为二进制:bin(10)2.2 十进制转化为八进制:oct(10)2.3 十进制转化为十六进制:hex(10)2.4 其他进制转化为十进制: int()三、十进制转化为固定长度的多进制类型3.1 转化为二进制3.2 转化为八进制3.3 转化为十六进制四、原码、反码和补...

2019-07-16 14:36:13 1228

原创 主成分分析

主成分分析一、简介二、问题三、主成分分析法一、简介一个非监督的机器学习算法主要用于数据的降维通过降维,可以发现更便于人类理解的特征其他特征:可视化;去噪从二维降到一维二、问题保留原有样本的特征?如何找到这个让样本间距最大的轴如何定义样本间间距使用方差三、主成分分析法第一步:将样例的均值归为0所有的样本减去样本的均值得到的新样本的均值为0...

2019-07-16 00:32:47 503

原创 梯度下降法

梯度下降法一、简介二、梯度下降法实现2.1 求出斜率【求导】2.2 theta对应的y值2.3 梯度下降法过程三、封装函数四、多元线性回归中的梯度下降法4.1 定义函数4.2 定义δJ4.3 定义梯度下降一、简介不是一个机器学习算法是一种基于搜索的最优化方法作用:最小化一个损失函数梯度上升法:最大化一个效用函数并不是所有函数都有唯一的极值点解决方案多次运行,随机化初始...

2019-07-15 13:00:51 321

原创 线性回归实现

线性回归实现一、实现简单线性回归1.1 简单线性回归1.2 绘制数据散点图1.3 封装简单线性回归1.4 向量化实现简单线性回归1.4.1 向量化实现性能测试二、线性回归算法的评测2.1 均方误差MSE2.2 均方根误差RMSE2.3 平均绝对误差MAE2.4 案例2.4.1 MSE运用2.4.2 RMSE运用2.4.3 MAE运用2.4.4 定义测算函数2.5 scikit-learn中调用2....

2019-07-14 14:59:42 904

原创 KNN算法(K近邻算法) and 网格搜索 and 归一化

KNN算法K近邻算法一、KNN基础# 导入库import numpy as npimport matplotlib.pyplot as plt# 特征值及目标值raw_data_x = [[3.54,2.54], [4.52,7.36], [1.34,3.36], [2.28,2.86], ...

2019-07-13 23:03:11 1679 1

原创 Hadoop配置 Ⅱ

Hadoop配置 Ⅱ2.1 完全分布式配置[外链图片转存失败(img-49vAdQDm-1562246814055)(en-resource://database/2268:0)]2.1.1 修改虚拟的名称以及存放目录1、修改名称2、改变目录3、修改虚拟机配置文件`xuqiao@s0:/usr/soft/hadoop-3.1.2/etc/hadoop_cluster$ gedit *...

2019-07-04 21:27:44 158

原创 集成学习

一、简介集成学习(Ensemble Learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类学习器系统(multi-classifier system).集成算法主要包括三大种类型,分别为:· Bagging【并行】个体学习器之间不存在强依赖关系、可同时生成的并行化方法· Boosting【串行】个体学习器间存在强依赖关系、必须串行生成序列化方法· Stac...

2019-07-04 14:06:42 162

原创 Hadoop 学习 Ⅰ

Hadoop PartⅠ一、Hadoop配置独立模式伪分布式完全分布式Hadoop目标——处理海量数据存储·分布式文件系统:HDFS, hadoop distributed file system.运算· mapreduce = map + reduce二、独立模式没有运行的守护程序,所有程序运行在一个JVM中。适合开发期间运行MapReduce程序,源于他...

2019-07-03 15:32:12 134

原创 Ubuntu中下载安装Hadoop

host:宿主机vwmare:虚拟机client:客户机网络连接方式1、桥接:客户机就相当于真实的主机,可以访问互联网、设置ip,互相访问,如果环境没有网络,主机之间无法连通2、NAT: 网络地址转换client 和宿主机形成网络,客户机可以访问互联网,由宿主机做DNS和NATip也是由宿主机分配,客户机无法访问网络中的其他主机没有网络的环境下,宿主机和客户机形成...

2019-07-02 23:32:07 2421 2

转载 【转载】Vi操作(黑马程序员)

vi —— 终端中的编辑器目标vi 简介打开和新建文件三种工作模式常用命令分屏命令常用命令速查图01. vi 简介1.1 学习 vi 的目的在工作中,要对 服务器 上的文件进行 简单 的修改,可以使用 ssh 远程登录到服务器上,并且使用 vi 进行快速的编辑即可常见需要修改的文件包括:源程序配置文件,例如 ssh 的配置文件 ~/.ssh/config...

2019-07-02 20:02:09 332

转载 python数据结构

Python与数据结构一、顺序表存储位置LOC(ai+1)LOC(a_{i+1})LOC(ai+1​)和第i个数据元素的存储位置为LOC(ai)LOC(a_i)LOC(ai​)之间满足下列关系LOC(aa+1)=LOC(ai)+l LOC(a_{a+1}) = LOC(a_i)+l LOC(aa+1​)=LOC(ai​)+l线性表的第iii个数据元素aia_iai​的存储位置为LO...

2019-07-02 20:01:31 124

原创 Ubuntu系统安装anaconda

Ubuntu系统安装anaconda一、去anaconda官网下载安装文件https://www.anaconda.com/distribution/二、安装anacondaxuqiao@ubuntu:~$ bash Anaconda3-2019.03-Linux-x86_64.sh bash: Anaconda3-2019.03-Linux-x86_64.sh: No such fi...

2019-06-30 16:04:56 1158

原创 Ubuntu系统信息相关命令

系统信息相关命令一、日期和时间二、磁盘信息三、进程信息TOP命令四、其他命令4.1 查找文件4.2 软链接4.3 硬链接在使用 ln 创建链接时,如果没有 -s 选项,会创建一个 硬链接,而不是软链接硬链接 仍然有五、打包压缩打包压缩 是日常工作中备份文件的一种方式在不同操作系统中,常用的打包压缩方式是不同的Wind...

2019-06-30 15:01:46 508

原创 决策树ID3、C4.5和CART算法总结,及案例计算

一、决策树决策树(Desicision Tree)是一种基本的分类与回归方法。决策树呈现树形结构,它可以认为是if-then规则的集合,可以认为是定义在特征空间与类空间上的条件概率分布。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型预测时,对新的数据利用决策树模型进行分类。决策树学习通常包括3个步骤:· 特征选择· 决策树的生成· 决策树的修剪决策树的算法主要包括三...

2019-06-29 14:22:37 6206

转载 Ubuntu用户权限设置

一、用户和权限的基本概念1.1 基本概念用户 是 Linux 系统工作中重要的一环,用户管理包括 用户 与 组 管理在 Linux 系统中,不论是由本机或是远程登录系统,每个系统都必须拥有一个账号,并且对于不同的系统资源拥有不同的使用权限在 Linux 中,可以指定 每一个用户 针对 不同的文件或者目录 的 不同权限对 文件/目录 的权限包括:读写执行 rwx1.2 组为...

2019-06-24 10:40:46 33840 2

转载 Ubuntu远程管理常用命令

Ubuntu远程管理常用操作命令一、关机/重启1.1 shutdown# 重新启动操作系统,其中 now 表示现在$ shutdown -r now# 立刻关机,其中 now 表示现在$ shutdown now# 系统在今天的 20:25 会关机$ shutdown 20:25# 系统再过十分钟后自动关机$ shutdown +10# 取消之前指定的关机计划$ ...

2019-06-23 13:29:04 483

转载 Ubuntu操作Ⅲ

Ubuntu操作Ⅲ一、查看文件内容1.1 catcat命令可以用来查看文件内容、创建文件、文件合并、追加文件内容 等功能cat 会一次显示所有的内容,适合 查看内容较少 的文本文件-b 与 -n 空行-b忽略空行1.2 morecat 与 more的操作1.3 grep二、其他2.1 echo2.2 > 和 >>2.3 管...

2019-06-23 09:50:07 91

转载 VMware虚拟机中设置Ubuntu 18.04的分辨率为1920*1080

1920*1080P分辨率参考文章:https://www.cnblogs.com/dlvguo/p/10486640.html

2019-06-22 23:54:03 6172 1

转载 Ubuntu操作Ⅱ

Ubuntu操作Ⅱ1、 ls中 -l -h操作xuqiao@ubuntu:~$ ls -l -htotal 64K-rw-rw-r-- 1 xuqiao xuqiao 1 Jun 4 07:37 aa.txtdrwxrwxr-x 2 xuqiao xuqiao 4.0K Jun 4 07:24 ab.txt-rw-rw-r-- 1 xuqiao xuqiao 14 Ju...

2019-06-22 19:59:21 118

原创 Ubuntu!!!

Ubuntu系统学习一、Ubuntu安装二、Ubuntu常用操作一、Ubuntu安装首先安装虚拟机 Vmware,然后下载Ubuntu镜像文件,安装。安装完成后:二、Ubuntu常用操作1、ls 查看当前目录文件2、mkdir 创建新文件/新目录3、rm 删除文件4、rm删除不了文件夹,可以删除文件,如果要删除文件夹 ,可以使用rmdir 操作或者使用rm -r -f...

2019-06-22 17:10:27 209

浙大概率论.zip

浙江大学概率论与数理统计的PPT,讲解十分详细,从理论到基础到例题,很详细!!!

2019-08-29

厦门大学统计学习方法课件.zip【参考统计学习方法】

厦门大学统计学习方法课件,PPT,你值得拥有。主要参考统计学习方法这本书,从这本延申,知识点更全面!

2019-08-22

Python 算法图解.pdf

Python算法图解,和小说一样有趣的算法入门书。本书易于理解,没有大跨度的思维跳跃,每次引入新概念时,都立即进行诠释,或者指出将在什么地方进行诠释。核心概念都通过练习和反复诠释进行强化,以便你检验假设,跟上步伐。

2019-07-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除