自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(63)
  • 收藏
  • 关注

原创 清华源地址

一个能助飞pip下载效率的地址。

2024-04-25 19:34:32 60

原创 爬虫解析——Xpath

XPath是一种用于在XML文档中定位节点的语言,它可以用于从XML文档中提取数据,以及在XML文档中进行搜索和过滤操作。它是W3C标准的一部分,被广泛应用于XML文档的处理和分析。XPath使用路径表达式来描述节点的位置,这些路径表达式类似于文件系统中的路径。路径表达式由一个或多个步骤(step)组成,每个步骤描述了一个节点或一组节点。步骤可以使用关系运算符(如/和//)来连接,以便描述更复杂的节点位置。XPath还提供了一些内置函数和运算符,可以对XML文档中的数据进行操作和计算。

2024-04-18 00:09:45 403

原创 爬虫入门——Request请求

上一篇爬虫我们已经提及到了urllib库的使用,为了方便大家的使用过程,这里为大家介绍新的库来实现请求获取响应的库。以上就是今天要讲的内容,本文仅仅简单介绍了requests的使用,而提供了大量能使我们快速便捷地处理数据的函数和方法。大多数内容跟urllib是没太大区别的,甚至还精简很多,对于爬虫玩家来说是十分友好的,希望你能去尝试一下,巩固一下,这里再做一个预告,在下一次我们将介绍如何使用Xpath对爬到的源代码进行解析,来获取我们想要的内容,敬请期待吧。

2024-04-18 00:09:22 745

原创 Linux shell:read命令之数据输入

赶快动手实践一下吧。--stdin在下节详细介绍。

2024-03-06 09:00:00 434

原创 Linux shell:查看信息

希望对你有所帮助,动手实践一下吧。

2024-03-06 08:30:00 336

原创 Javascript:分支语句

关于分支语句的介绍来啦,开始记笔记。希望对你有所帮助,动手实践一下吧。

2024-03-05 22:10:20 235

原创 H5:列表

名词1名词1解释1名词1解释2

2024-03-05 21:39:00 358

原创 Javascript:运算符

开始对运算符的介绍,开记!希望对你有所帮助,动手实践一下吧。

2024-03-04 18:35:25 276

原创 H5:表格标签的使用

希望对你有所帮助,赶快尝试建立一个表格吧。

2024-03-04 16:34:48 295

原创 杂谈:关于机器学习

为了系统的学习机器学习,在之后的文章会推出有关机器学习的算法以及个人思路,先前在初探的时候已经粗略的解释了线性回归,后面我们从原理算法一并入手带给大家,至于讲过的数据分析和特征工程,有些地方确有粗糙,这是个人能力的不足请见谅,后面会引入案例更加清晰地通过方法解决问题。

2024-03-03 19:30:44 84

原创 Javascript:类型转换

希望对你有所帮助,动手尝试一下吧!

2024-03-03 19:23:36 302

原创 Javascript:数组的使用

为了能存储多个数据,我们接下来介绍数组。希望对你有所帮助,赶紧动手试一试吧。

2024-03-03 19:19:07 240

原创 H5:超链接标签(重点)

希望对你有所帮助,动手实践一下。

2024-03-03 14:23:36 462

原创 Javascript:常量与数据类型

介绍完变量之后我们来对常量进行了解一番,关于常量我们需要知道些什么呢?希望对你能起到帮助,多多尝试,探索更多别有一番的天地。

2024-03-02 15:10:29 725

原创 H5:图像标签和路径

本篇介绍有关标签和路径,关于图像标签我们来看看有什么需要注意的。看完之后希望对你有所帮助,记得多加尝试,实践出真知。

2024-03-02 15:07:15 327

原创 Javascript:变量声明,赋值,更新

接着我们来了解有关变量的操作。希望对你有所帮助,动手实践尝试一下,相信你也可以。

2024-03-01 14:51:40 503

原创 H5:文本格式化标签与盒子标签

接着上一篇我们来学习相关的标签。希望对你有所帮助。实践看看效果吧。

2024-03-01 14:46:26 224

原创 H5:段落标签与换行标签

学习前端,从此起飞,愿你坚持,直至等顶。看完后记得实操一下,实践出真知!

2024-02-29 21:45:49 381

原创 Javascript:输入输出

Javascript作为运行浏览器的语言,对于学习前端的同学来说十分重要,那么从现在开始我们将开始介绍有关 Javascript。希望对您能有所帮助,坚持学习吧。

2024-02-29 21:16:27 471

原创 Linux shell:补充命令的使用

希望看篇能提高你的认知。

2024-02-27 23:35:05 220

原创 Linux shell : 梦开始的地方之Hello world

什么是shell脚本呢?简单来说就是将Linux系统的命令写入一个文件当中。而脚本文件的优势就是在于一旦编写完成,用户就可以自动完成脚本文件中的所有命令,而且,相同的脚本文件,可以多次反复的调用并执行,避免不必要的命令重复输入的工作。希望你能坚持下去学习,一些相关命令在下一篇展开。

2024-02-27 23:01:19 551

原创 牛客网:牛牛学数列

通过观察我们可以发现,每一项分母的变化有一个通式来决定,所以我们需要通过一个循环把每一项加起来之后被1除,而这只是其中的一项,然而每一项分母相加的个数是随着项数取决的,于是i要小于j,每一项的sum求和在新的一次循环当中要重置为0,以防被上一次的循环所影响。输入一个整数n,计算 1+1/(1-3)+1/(1-3+5)+...+1/(1-3+5-...((-1)^(n-1))*(2n-1))的值。输出一个浮点数,保留3位小数。更多精彩内容等你来来看。

2024-02-23 02:54:46 179

原创 Python进阶:函数式编程

函数式编程(Functional Programming)作为一种编程范式,近年来在软件开发领域备受关注。它强调将计算视为数学函数的评估,避免了可变状态和可变数据。本文将深入探讨函数式编程的核心概念、优势以及在现代软件开发中的应用。函数式编程是一种强大的编程范式,它通过纯函数、不可变性和高阶函数等核心概念为软件开发带来了许多优势。在当前软件工程日益复杂的环境下,函数式编程的理念为我们提供了一种更清晰、更健壮的编程方式。

2024-02-10 04:04:17 158

原创 特征工程:数据平衡

大多数情况下,使用的数据集是不完美的,会出现各种各样的问题,尤其针对分类问题的时候,会出现类别不平衡的问题。例如:在垃圾邮件分类时,垃圾邮件数据会有较少的样本量,从而导致两种类型的邮件数据量差别很大;在欺诈监测数据集中,往往包含的欺诈样本并没有那么多。处理这类数据集的分类的时候,需要对数据集的类不平衡问题进行处理。数据分析的整个过程的介绍就结束了,那接下来就是关于模型的选择与评估问题,只不过对数据分析着实重要,在之后的几篇当中,我们需要对数据分析有着更加细致的了解或者案例切入。

2024-02-10 03:57:58 461

原创 Python进阶:标准库

Python 的强大之处不仅在于其简洁易读的语法,还在于其丰富的标准库。标准库中包含了各种各样的模块和工具,涵盖了从文件操作到网络编程数据处理等各个方面的功能。本文将深入探讨 Python标准库的重要性、常用模块以及在实际开发中的应用场景。Python 标准库是 Python 编程中不可或缺的一部分,它为开发者提供了丰富的功能和工具,极大地提高了开发效率和代码质量。通过深入学习和灵活运用标准库中的各种模块,我们可以更加轻松地完成各种任务,实现各种功能,为 Python 开发增添更多的可能性。

2024-02-09 19:19:32 542

原创 Python进阶:迭代器生成器

在 Python 编程中,迭代器(Iterators)和生成器(Generators)是非常重要的概念,它们能够帮助我们处理大量数据、提高代码效率,并且在处理大型数据集时节省内存。本文将深入探讨迭代器和生成器的概念、用法以及在实际应用中的示例。迭代器和生成器是 Python 编程中非常强大和灵活的工具,它们可以帮助我们高效地处理大型数据集合,减少内存消耗,并且使代码更加简洁易懂。通过深入理解迭代器和生成器的概念和用法,我们可以写出更加优雅和高效的 Python 代码。

2024-02-09 19:15:32 61

原创 特征工程:特征提取和降维-下

通过上篇对线性与非线性的数据的特征提取和降维的学习之后,我们来介绍其他方法,分别有流行学习、多维尺度分析、t-SNE。

2024-02-08 00:33:34 780

原创 特征工程:特征提取和降维-上

前面介绍的特征选择方法获得的特征,是从原始数据中抽取出来的,并没有对数据进行变换。而特征提取和降维,则是对原始数据的特征进行相应的数据变换,并且通常会选择比原始特征数量少的特征,同时达到数据降维的目的。常用的数据特征提取和降维的方法有主成分分析,核成分分析,流行学习,t-SNE,多维尺度分析等方法。

2024-02-08 00:01:35 975

原创 Python基础入门:标准输入输出

在Python编程中,标准输入(stdin)和标准输出(stdout)是至关重要的概念,它们提供了与程序外部环境进行交互的途径。本文将深入探讨Python中的标准输入输出,包括如何使用标准输入输出、标准流的工作原理以及一些高级技巧。标准输入输出是Python编程中不可或缺的部分,它们为程序提供了与用户和外部环境进行交互的接口。通过灵活运用标准输入输出,我们能够编写更加交互性强、功能丰富的Python程序。深入理解标准输入输出的原理和应用,对于提高程序的可读性、可维护性和可扩展性具有重要意义。

2024-02-07 00:57:09 363

原创 特征工程:特征选择

特征选择是使用某些特征统计的方法,从数据中选出有用的特征,把数据中无用的特征抛弃掉,该方法不会产生新的特征,常用的方法有基于统计方法的特征选择、利用地柜消除法选择有用的特征、利用机器学习算法选择重要的特征等。

2024-02-07 00:44:27 1348

原创 Python基础入门:异常处理

在Python编程中,异常处理是确保程序稳定性和可靠性的关键组成部分。异常是指在程序执行期间发生的意外事件,例如文件不存在、除零错误等。本文将深入探讨Python异常处理的机制、常见的异常类型、如何使用try和except语句以及一些高级的异常处理技巧。通过深入了解Python异常处理机制,开发者能够更好地应对不可预测的情况,提高程序的健壮性和可维护性。合理而灵活地运用异常处理是编写高质量Python代码的关键。

2024-02-06 15:55:43 372

原创 特征工程:特征构建

特征工程中的特征构建的主要目的是生成新的特征,而针对不同的特征,有多种方式可以形成新的特征,例如有针对分类特征、针对数值特征和针对文本特征对其进行生成新的特征。

2024-02-06 15:47:52 1820

原创 Python基础入门:文件操作

在Python这个强大而灵活的编程语言中,文件操作是一个至关重要的主题。无论是数据处理、配置管理还是日志记录,文件操作都扮演着至关重要的角色。本文将深入探讨Python中文件操作的各个方面,包括读取、写入、处理异常、以及一些高级的技术和最佳实践。通过全面而深入的探讨,读者将能够更好地理解Python中文件操作的方方面面,并能够在实际应用中更加灵活地使用这一重要的编程工具。文件操作不仅是编程的基础,更是构建各种应用的关键步骤,深入理解这一主题将使你能够更高效地处理数据、管理配置和记录日志。

2024-02-05 23:22:47 278

原创 特征工程:特征变换

特征工程作为机器学习数据准备的核心任务,我们应当重视这一部分的数据的处理工作,主要就是通过变换数据集的特征空间,从而提高数据集的预测模型性能。针对数据集的不同情况,我们可以有多种选择对数据集的特征工程进行处理,如:特征变换,特征构造,特征选择,特征提取或降维,又或者是数据平衡。那么接下来我们将对特征工程中的特征变换先做介绍。特征变换讲到这里就结束了,希望能够对你有帮助。

2024-02-05 16:22:28 1020

原创 数据描述的统计量解释-上

对于众数、中位数、极差简单概念这里不再过多强调,下面开始来介绍。

2024-02-04 15:45:00 1079

原创 数据描述的统计量解释-下

在下篇我们来介绍关于偏峰度与相关系数的统计量的介绍对于数据描述的统计量到这里就结束了,希望能对你有所帮助。

2024-02-04 14:48:40 918

原创 数据探索与可视化:数据样本距离

接下来,我们进入数据探索与可视化的最后一个部分:数据样本距离。对于给定的数据样本,每个样本具有多个特征,因此每个样本均是高维空间的一个点,那么在高维空间当中如何比较样本之间的距离远近或相似程度是个重要的点。 距离在聚类分析,分类等多种应用中都有重要地位,不同的距离度量的方式可能会有不同的分析结果,那么接下来让我们来看看都有哪些: 欧式距离可解释为。欧式距离公式非常简单,使用勾股定理从这些点的计算距离。 缺点:尽管这是一种常用的距离度量,但欧式距离并的,这意味着所计算的距离可能会根据。通常,在使用欧式距离度量

2024-02-03 23:57:11 923

原创 Python基础入门:模块和包

目录一.导读二.介绍 1.模块①创建和使用模块②命名空间和别名2.包①创建和使用包②包的嵌套三结尾 在Python中,模块(Module)和包(Package)是组织和管理代码的重要工具。它们使得代码更加模块化、可维护,同时也促进了代码的重用性和可扩展性。本文将深入探讨Python中模块和包的概念、用法以及它们在实际开发中的重要性。 在Python中,一个模块就是一个包含Python代码的文件,它可以包含变量、函数和类的定义。通过将相关功能组织在模块中,我们可以更好地管理和组织代码,使其更易读、易懂。 创

2024-02-03 13:45:00 231

原创 数据探索与可视化:可视化分析数据-下

那么本篇将互怼其他类型的数据分析的可视化方法进行介绍,它们分别是:时间序列,文本数据,社交网络数据。plt.show()通过pd的read_csv的方法对数据进行读取,然后刻画折线图,俺么我们就能得出随着时间的变化值的变化大小。当然在数据当中我们还未对缺失的数据进行处理以及一些异常值的过滤,这些将交给你,通过处理后的数据进行可视化才能够更加的完善,判断数据的变化趋势才有足够的根据性。

2024-02-02 18:05:42 937

原创 Python基础入门:带你解锁解锁代码重用和结构化编程的钥匙——函数

在Python中,函数通过def# 函数体# 可以包含一系列操作return result # 可选的返回值。

2024-02-02 13:45:00 233

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除