自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 数据结构和算法:“变位词”判断问题

数据结构和算法:“变位词”判断问题

2022-07-25 15:25:44 407 1

原创 数据结构和算法-大O表示法

数据结构和算法-大O表示法

2022-07-25 15:25:03 769

原创 机器学习加强-随机森林

一、 概述1.1 集成算法概述 集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通 过在数据上构建多个模型,集成所有模型的建模结果。目标:集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,以此来获取比单个模型更好的回归或 分类表现。在现在的各种算法竞赛中,随机森林,梯度提升树(GBDT),Xgboost等集成 算法的身影也随处可见,可见其效果之好,应用之广。多个模型集成成为的模型叫做集成评估器(ensem...

2022-05-16 15:07:19 4124

原创 sklearn强化学习-决策树算法

一、决策树定义是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规 则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。可以看出,在这个决策过程中,我们一直在对记录的特征进行提问。最初的问题所在的地方叫做根节点,在得到结 论前的每一个问题都是中间节点,而得到的每一个结论(动物的类别)都叫做叶子节点。关键概念:节点根节点:没有进边,有出边。包含最初的,针对特征的提问。中间节点:既有进边也有出边,进边只有一条,出边可以有很多条。都是针对特征的提问。叶子节点:

2022-05-12 18:13:10 2001

原创 机器学习基础三

模型的保存和加载:import joblib# 保存训练好的模型joblib.dump(trained_model, dirs+'/trained_model.pkl') # 读取模型dirs = 'testModel' #之前用于保存模型的文件夹model = joblib.load(dirs+'/trained_model.pkl')分类算法-逻辑回归算法逻辑回归是解决二分类问题的利器逻辑回归公式输出:[0,1]区间的概率值,默认0.5作为阀值注:g(

2022-05-12 11:38:23 138

原创 机器学习基础-回归算法

一 、线性回归分析回归问题判断条件:1.目标值连续线性关系模型:二维:直线关系三维:特征,目标值,平面关系试图学得一个通过属性的线性组合来进行预测的函数:线性关系(单个特征): f(x)= wx+b w为权重b为偏置项:为了是对于让单个特征的情况更加通用线性关系(多个特征)如下:线性回归:定义:线性回归通过一个或者多个自变量与因变量之间之间进行建模的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合一元线性回归:涉及到的变量只有一个多元线性..

2022-05-10 15:24:53 347

原创 机器学习基础-精确率和召回率

分类模型的评估estimator.score():一般最常见使用的是准确率,即预测结果正确的百分比混淆矩阵在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类)精确率(Precision)与召回率(Recall)分类模型评估API•sklearn.metrics.classification_report...

2022-05-09 15:42:08 1389

原创 机器学习基础-k近邻算法(KNN)

k近邻算法(KNN)定义: 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 来源:KNN算法最早是由Cover和Hart提出的一种分类算法 思想:相似的样本,特征之间的值应该都是相似的 特征处理:需要做标准化处理计算距离公式:两个样本的距离可以通过如下公式计算,又叫欧式距离比如说:a(a1,a2,a3),b(b1,b2,b3)sklearn k-近邻算法API:...

2022-05-07 14:21:23 698

原创 机器学习基础二

特征选择从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征。主要方法(三大武器):Filter(过滤式):VarianceThreshold Embedded(嵌入式):正则化、决策树 Wrapper(包裹式)特征选择原因...

2022-05-06 18:20:48 360

原创 机器学习基础一

一 、机器学习概述1.什么是机器学习 机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。2.为什么需要机器学习解放生产力,解决专业问题,提供社会便利3.机器学习的应用场景邻域:医疗、航空、教育、物流、电商....目的:让机器学习程序替换手动的步骤,减少企业的成本也提高企业的效率二、数据集的构成1.数据来源文件(CSV、xlsx等等)2.数据集的结构可用的数据集:kaggle sciket-learn uci常用数据结集...

2022-05-05 18:20:15 134

原创 数据结构和算法-线性表

一、线性表概念一组序列元素的组织形式,我们可以将其抽象为线性表。一个线性表是某类元素的一个集合,还记录着元素之间的一种顺序关系。线性表是最基本的数据结构之一,在实际程序中应用非常广泛,它还经常被用作更复杂的数据结构的实现基础。根据线性表的实际存储方式,分为两种实现模型:顺序表,将元素顺序地存放在一块连续的存储区里,元素间的顺序关系由它们的存储顺序自然表示。 链表,将元素存放在通过链接构造起来的一系列存储块中。二、顺序表顺序表分类:顺序表结构:个顺序表的完整信息包括两部分,一部分是

2022-04-14 17:46:24 332

原创 数据结构和算法-引入概念

一、 算法的概念算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。算法是独立存在的一种解决问题的方法和思想。二、算法的五大特性输入: 算法具有0个或多个输入 输出: 算法至少有1个或多个输出 有穷性: 算法在有限的步骤之后会自动结束而不会无限循环,并且每一个步骤可以在可接受的时间内完成 确定性:算法中的每一步都有确定的含义,不会出现二义性 可行性:算法的每一步都是可行的,也就是说每一步都能够执行有限的次数完三三、算法效率的衡量.

2022-04-12 12:20:08 122

原创 机器学习高数基础-集合和实数集

学习目标:掌握集合和实数集的定义和定理学习内容:一 、集合定义及相关定理: 1.1集合定义:“一堆东西”放在一起,成为集合(set),通常用 A 表示; 1.2元素定义:“一堆东西”里面的一个称之为元素(element),通常用 a 表示; 1.3集合描述方式: 列举 A={1,2,3} 描述 A={x: x是有理数} 1.4子集:A的每个元素都在B中,记为A⊆ B(A是B的子集) ...

2022-03-17 23:54:33 1297

原创 机器学习与安全-日志数据挖掘入门到实践

前言 随着云计算、大数据、物联网、移动互联网等新兴技术的高速发展和应用,数以万计的设备和应用产生的海量日志数据,给日常运维和安全工作带来了巨大的困难和挑战;因此博主想通过机器学习对海量日志数据进行挖掘和分析,帮助日常工作的开展;本文会记录博主的日常学习、项目和比赛总结,同时也欢迎大家多多指点迷津。学习目标:利用机器学习分析海量日志数据,帮助日常安全和运维工作的开展。学习内容:一、数学阶段包括:高数基础、概率基础、统计基础二、基础阶段包括:Python基础知识、Pyt...

2022-03-17 10:52:07 689

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除