- 博客(43)
- 收藏
- 关注
原创 实战深度学习--进行蘑菇分类
本笔记将介绍如何使用Python和深度学习库(如TensorFlow和Keras)来构建一个卷积神经网络(CNN)模型,以区分可食用和有毒的蘑菇。我们将从数据准备、模型构建、训练和评估等方面进行详细说明。
2024-07-25 16:09:30 686 1
原创 实战机器学习--决策树分类器在蘑菇分类中的应用
通过以上步骤,我们成功地使用决策树分类器对蘑菇图片进行了分类。这种方法可以扩展到其他图像分类任务中,只需调整数据路径和相应的处理逻辑即可。决策树是一种简单但有效的分类方法,适合初学者理解和应用。然而,对于更复杂的任务,可能需要更高级的模型,如深度学习模型。
2024-07-25 15:49:32 790
原创 Python--Spark RDD filter 方法使用及性能优化笔记
在Apache Spark中,RDD(弹性分布式数据集)是基本的数据结构,用于处理大规模数据集。filter是 RDD 的一个常用方法,用于对数据进行过滤,只保留满足特定条件的数据。
2024-07-22 21:45:00 1249
原创 Python--Spark RDD 操作和数据聚合笔记
Apache Spark 的 RDD(弹性分布式数据集)是用于并行处理的基石,能够容错且具有高吞吐量。本笔记详细介绍了 Spark RDD 的操作,包括环境配置、创建 RDD、使用flatMap和其他转换操作,以及数据聚合方法。还包括了复杂数据处理的示例,如日志文件分析和商品销售数据聚合,以及如何有效进行数据分区和重组操作的策略。通过这些知识点和示例,可以高效地处理和分析大规模数据集,优化 Spark 作业的性能和资源利用率。在实际应用中,根据数据特性和作业需求选择合适的方法和策略至关重要。
2024-07-22 17:58:39 528
原创 Python--递归与非递归遍历文件夹的方法
方法在遇到权限错误时也会抛出异常,但它提供了更现代的面向对象的API,可以与异常处理结合使用。递归是一种强大的技术,但需要谨慎使用。:如果程序运行在具有较少权限的用户下,考虑以更高权限运行程序,例如使用。:在某些情况下,可能需要修改文件夹的权限,以便用户可以访问。:如果程序是交互式的,可以向用户报告权限错误,并提示他们采取适当的行动。:记录权限错误的详细信息到日志文件中,有助于事后分析。之前,先检查子目录的权限,如果无权限则不进行递归。是一个迭代器,可以遍历目录中的文件和目录。
2024-07-22 04:45:00 1069
原创 Python--for循环
通过这些示例和扩展,可以更深入地理解for循环的用法和应用场景。for循环是Python中处理序列数据的强大工具,掌握其用法对于编写高效、易读的代码至关重要。for循环是Python中的一种迭代语句,用于遍历序列类型的数据。与while循环相比,for循环是一种更为直观的迭代方式,因为它直接内置了遍历机制。是一个内置函数,用于生成数字序列,常用于for循环中。
2024-07-21 00:00:00 422
原创 Python--使用Python从MySQL数据库导出数据到JSON文件
这段代码演示了如何使用Python从MySQL数据库查询数据,并将查询结果以JSON格式导出到文件。
2024-07-21 00:00:00 510
原创 Python--将文本和JSON文件数据导入MySQL数据库
本案例展示了如何从文本文件和JSON文件中读取销售数据,并将这些数据导入到MySQL数据库中。
2024-07-21 00:00:00 517
原创 Python--字典(Dictionary)
字典是Python中的一种内置数据结构,用于存储键值对(Key-Value pairs)。每个键值对用冒号(:)分隔,键值对之间用逗号(,)分隔,整个字典用花括号({})包围。
2024-07-20 12:00:00 358
原创 Python--文件读取类设计
这种设计遵循了面向对象编程中的继承原则,使得不同的文件读取操作可以共享相同的接口。通过这些扩展,代码变得更加健壮和灵活,能够更好地处理实际开发中可能遇到的问题。,这个类用于读取 JSON 格式的文件。方法,实现了从文本文件中读取数据并将其转换为。方法,将 JSON 格式的字符串转换为。中,每行是一个 JSON 字符串,使用。中,每行文本通过逗号分隔,然后转换为。是一个抽象类,它定义了一个抽象方法。函数将其转换为字典,再进一步转换为。这个类用于读取文本文件。的子类都必须实现这个方法。,它们都继承自抽象类。
2024-07-20 12:00:00 549
原创 Python--闭包和装饰器高级应用
闭包和装饰器是Python中两个强大的特性,它们可以显著提升代码的灵活性和性能。以下是一些闭包和装饰器的使用示例和解释。
2024-07-20 01:00:00 1168
原创 Python--正则表达式使用元字符进行匹配
正则表达式通过使用元字符定义匹配规则,可以非常灵活地处理各种文本匹配需求。理解这些元字符及其组合方式是掌握正则表达式的关键。通过实际的示例代码,可以更好地理解正则表达式的使用方式和效果。在实际应用中,可以根据具体需求调整正则表达式,以匹配不同的文本模式。例如,可以通过增加或修改元字符来匹配更复杂的文本结构,或者使用不同的标志来改变匹配行为(如忽略大小写)。
2024-07-20 00:45:00 286
原创 Python--内置魔术方法笔记
在 Python 中,魔术方法(也称为特殊方法或双下方法)是一些具有特殊名称的方法,它们可以被内置函数或操作符调用,从而改变类的行为。这些方法通常以双下划线开头和结尾。魔术方法是 Python 中一种强大的机制,通过它们可以扩展类的行为,使其更符合预期。掌握魔术方法的使用,可以提高代码的灵活性和可读性。希望这篇笔记能帮助你更好地理解和使用 Python 的魔术方法。
2024-07-20 00:30:00 521
原创 Python--正则表达式re模块基础匹配方法
match方法从字符串的开始位置匹配模式,适合确定字符串是否完全符合某个模式。search方法在整个字符串中搜索第一个匹配项,适合查找字符串中是否存在某个模式。findall方法查找所有匹配项,适合获取字符串中所有符合模式的子串。这些方法在处理文本数据、进行模式匹配和数据提取时非常有用。通过掌握这些基本方法,可以更灵活地使用正则表达式来解决各种文本处理问题。Q1:如何使用Python正则表达式进行复杂的文本匹配?
2024-07-20 00:30:00 1288
原创 Python--PyMySQL 库基础操作笔记
pymysql是一个 Python 库,用于连接和操作 MySQL 数据库。它提供了一个简单的 API,使得在 Python 程序中执行 SQL 语句变得容易。
2024-07-20 00:15:00 214
原创 Python--JSON
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成。它基于文本,是完全独立于编程语言的。
2024-07-20 00:00:00 291
原创 Python--PySpark 综合案例笔记
数据读取:使用textFile方法读取文本文件。数据处理:通过mapfiltersortBy等方法进行数据转换和聚合。结果输出:使用take方法获取结果,使用方法将结果写入文件。注意事项:在本地模式下,确保数据在单个分区中进行排序和聚合,避免数据在多个分区中分布导致的不一致性。通过这个案例,可以深入理解PySpark的基本操作和数据处理流程,为更复杂的大数据处理任务打下基础。
2024-07-20 00:00:00 387
原创 Python--PySpark 综合案例笔记
数据读取:使用textFile方法读取HDFS上的文本文件。数据处理:通过mapfiltersortBy等方法进行数据转换和聚合。结果输出:使用take方法获取结果,使用方法将结果写入HDFS上的文件。注意事项在集群模式下,设置合适的并行度可以提高数据处理效率。使用确保数据在单个分区中进行排序和聚合,避免数据在多个分区中分布导致的不一致性。将数据转换为JSON格式时,确保每个字段都正确映射到字典中。
2024-07-20 00:00:00 955
原创 Python--Python模块导出与__name__的使用
这段代码演示了Python模块中如何使用__all__变量和__name__特殊变量,以及如何定义可导出的函数。
2024-07-19 00:00:00 306
原创 Python--pyecharts 入门笔记
pyecharts 是一个基于 Echarts 的 Python 数据可视化库。Echarts 是百度开源的一个数据可视化工具,因其良好的交互性和精美的图表设计而广受开发者欢迎。pyecharts 将 Echarts 的强大功能与 Python 的数据处理能力结合起来,使得数据可视化变得更加简单和直观。
2024-07-18 18:00:00 689
原创 Python--循环控制语句:continue 和 break
在Python编程中,continue和break是两个非常有用的循环控制语句,它们允许我们以不同的方式控制循环的执行流程。continue。
2024-07-18 12:00:00 916
原创 Python--print函数的end参数
print是Python中用于输出内容到控制台的函数。默认情况下,每次调用print函数后,输出的内容都会自动换行。通过合理使用print函数的end参数,可以实现更灵活的输出控制,满足不同场景下的特定需求。掌握这一技巧,可以让编程中的输出更加符合预期。
2024-07-18 12:00:00 968
原创 Python--算术运算符和赋值运算符
通过这些运算符,可以方便地进行数学运算和变量赋值。掌握这些基础是编程中不可或缺的一部分,特别是在处理数据和执行算法时。
2024-07-18 06:00:00 889
原创 Python--PySpark 综合案例
**数据处理**:通过`map`、`filter`、`reduceByKey`、`sortBy`等方法进行数据转换和聚合。- **结果输出**:使用`take`方法获取结果,使用`saveAsTextFile`方法将结果写入HDFS上的文件。- **数据读取**:使用`textFile`方法读取HDFS上的文本文件。1. **Python环境**:指定Python解释器路径。2. **Hadoop环境**:指定Hadoop安装路径。1. **读取文件**:将文件内容读取为RDD。
2024-07-18 00:35:15 589
原创 Python--if-else语句
通过这些示例和扩展,可以更深入地理解if-else语句的用法和应用场景。掌握if-else语句对于编写能够根据不同条件作出响应的程序至关重要。if-else语句是实现条件分支控制的基本结构,允许程序根据不同的条件执行不同的代码块。
2024-07-18 00:00:00 323
原创 Python--MySQL及其使用
MySQL 是一个开源的关系型数据库管理系统(RDBMS),广泛用于各种应用程序,支持多种操作系统。它使用 SQL 语言进行数据查询、管理和操作。
2024-07-18 00:00:00 700
原创 Python--if-elif-else语句
通过这些示例和扩展,可以更深入地理解if-elif-else语句的用法和应用场景。合理使用这些语句可以增强程序的逻辑判断能力,使代码更加灵活和强大。if-elif-else语句用于基于多个条件进行不同的操作。它允许你检查多个条件,并执行与第一个成立的条件相关联的代码块。嵌套if语句允许在一个条件块内部根据另一个条件进行进一步的判断。
2024-07-17 00:00:00 318
原创 Python--标识符命名规则
通过这些示例和扩展,可以更深入地理解Python中标识符的命名规则和约定。良好的命名习惯有助于编写清晰、易于理解的代码。在Python中,标识符用于变量名、函数名、类名、模块名和常量名等的命名。
2024-07-16 00:00:00 1013
原创 Python--if语句
通过这些示例和扩展,可以更深入地理解if语句的用法和应用场景。合理使用if语句可以增强程序的交互性和逻辑判断能力。if语句是Python中用于条件判断的语句。它根据条件是否成立来决定是否执行特定的代码块。
2024-07-16 00:00:00 585
原创 Python--while循环
while循环是 Python 中用于重复执行代码块的一种控制结构,它允许你根据条件的真值来多次执行一段代码。只要条件为真,循环就会继续执行。一旦条件变为假,循环就会停止。
2024-07-15 11:40:31 445
原创 Python--数据定义类 Record 的分析与扩展
Record在Python中,使用class关键字定义一个类,Record类用于存储订单记录的相关信息。date:订单日期order_id:订单IDmoney:订单金额province:销售省份类初始化方法__init__用于在创建类的实例时设置这些属性。
2024-07-15 11:20:14 553
原创 Python --布尔类型与比较运算符
布尔类型是Python中的一种基本数据类型,用于表示逻辑值。True和False,分别代表真和假。TrueFalse在Python中,布尔类型是bool类的实例。可以使用type()函数来查看变量的类型。
2024-07-14 19:41:30 458
原创 Python--银行ATM模拟程序
本笔记将通过一个模拟银行ATM系统的Python程序来探讨Python编程中的几个关键概念,包括全局变量、函数、输入输出以及循环控制。
2024-07-14 19:40:55 482
原创 Python--GDP动态柱状图开发
首先需要有数据源,本例中为CSV文件,包含了1960-2019年全球GDP数据。:使用Python的文件操作读取CSV文件,并将数据转换为字典格式,便于后续处理。:使用pyecharts的Timeline对象来管理多个时间点的数据,实现动态展示。:对于每个时间点,创建一个Bar对象,添加x轴和y轴数据,并设置标签显示位置。:对每个年份的数据进行排序,并筛选出前8名国家的数据。:通过方法反转x轴和y轴,以适应数据展示需求。:为每个柱状图设置全局选项,如标题等。:将每个年份的柱状图添加到时间线对象中。
2024-07-14 17:30:30 1037
原创 Python--pycharm快捷方式+注释
对是否安装成功的测试以下是pycharm中的一些快捷方式:打开软件设置:复制当前行代码:将当前行代码上移或下移:运行当前代码文件:重命名文件:全选:复制、粘贴、剪切:搜索。
2024-07-14 16:15:15 1221
原创 洛谷[普及]:P1149 [NOIP2008 提高组] 火柴棒等式
给你 n 根火柴棍,你可以拼出多少个形如 A+B=C 的等式?等式中的 A、B、C 是用火柴棍拼出的整数(若该数非零,则最高位不能是 0)。2 个等式为 0+1=1 和 1+0=1。1. 加号与等号各自需要两根火柴棍;3. $n$ 根火柴棍必须全部用上。一个整数,能拼成的不同等式的数目。noip2008 提高第二题。【输入输出样例 1 解释】【输入输出样例 2 解释】
2024-05-22 23:59:31 613 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人