自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 Python 爬虫 · bs4 模块基础

本文介绍了使用Python的BeautifulSoup4(bs4)库解析HTML/XML文档的方法。主要内容包括:1) bs4模块简介及安装方法;2) 基本使用方法:从模块导入、创建解析对象到常用查找方法;3) 详细演示了find()和find_all()方法,包括按标签名、属性筛选等操作,并展示了获取元素文本和属性的示例代码。该教程适合初学者学习网页数据抓取技术。

2026-06-09 13:10:13 160

原创 Python 爬虫 · HTML 与 CSS 基础

本文介绍了HTML和CSS的基础知识。HTML是网页的核心标记语言,通过标签组织内容,包含<html>、<head>、<body>等基本结构标签,以及文本、列表、表格等常用元素标签。CSS用于控制网页样式,介绍了11种选择器(通用、标签、类、ID等)及其优先级规则,以及多种伪类和伪元素选择器的使用方法,帮助实现精准的样式控制。这些知识为网页爬取时识别和提取特定内容提供了基础。

2026-06-07 15:57:20 233

原创 Python 爬虫 · 正则表达式与 re 模块基础

本文总结了Python正则表达式(regex)的基础知识及应用。正则表达式通过元字符(如\w, \d)和量词(*, +, {n})组合实现高效文本匹配,支持贪婪/惰性匹配模式。重点介绍了re模块的8个核心函数:match()从开头匹配、search()全局搜索、findall()返回所有匹配、sub()替换文本等。每个函数配有代码示例说明用法,如re.compile()预编译提升效率,subn()返回替换次数。正则表达式适用于数据验证、日志分析等场景,是Python文本处理的强大工具。

2026-06-06 19:34:51 219

原创 Python 爬虫 · requests 模块基础

本文介绍了Python requests模块的基本使用方法。该模块是Python中最常用的HTTP请求库,可用于发送网络请求、爬取网页数据等。主要内容包括:1)模块安装方法;2)发送GET请求和查看响应结果;3)伪装请求头应对反爬;4)携带参数请求;5)设置超时时间;6)使用Cookie登录;7)下载文件;8)发送POST请求;9)异常处理。文章通过具体代码示例,详细说明了每个功能的实现方式,特别强调了请求头伪装和异常处理的重要性,适合Python爬虫初学者学习使用。

2026-04-10 22:33:07 1836

原创 Python 爬虫 · http 协议基础

本文总结了Python爬虫学习中HTTP与HTTPS协议的区别,以及爬虫需要关注的请求头和响应头信息。HTTP采用明文传输(端口80),HTTPS通过SSL加密(端口443)。爬虫请求头需特别注意User-Agent、Referer等必带项,以及Cookie、Authorization等权限相关字段。响应头需关注状态码(如200、301等)、Set-Cookie、Content-Type等关键信息。最后对比了浏览器与爬虫的差异:浏览器执行JS并渲染页面,请求行为自然;爬虫仅获取原始HTML,需手动维护会话,

2026-04-04 21:06:31 2429

原创 Python 爬虫 · 理论基础

网络爬虫是一种自动化抓取网络信息的程序,广泛应用于搜索引擎、数据聚合、商业情报等领域。根据目标来源可分为网页爬虫、API爬虫等;按工作方式分为通用爬虫、聚焦爬虫等;按是否需要浏览器渲染分为静态爬虫和动态爬虫。爬虫的基本流程包括目标设定、网页抓取、数据解析和存储等环节。使用爬虫时需遵守robots协议,控制请求频率,避免违规操作。

2026-04-03 14:14:49 1966

原创 Python 数据分析 · 通用全流程串联

本文总结了Python数据分析的通用流程和关键函数,主要包含四个环节:1)数据导入/导出,介绍CSV和JSON文件的特性及处理方法;2)数据清洗,涵盖缺失值处理、重复值处理、数据类型转换、数据变形等操作;3)数据分析,汇总常用统计函数;4)数据可视化,对比pandas、matplotlib和seaborn三种绘图工具的特点,并列出常用图表类型和绘图参数。全文通过代码示例详细演示了各环节的核心操作,为Python数据分析提供了一套完整的技术参考。

2026-03-03 08:30:00 1310

原创 Python 数据分析 · Matplotlib 绘图 - 可视化

本文介绍了Python中使用Matplotlib库进行数据可视化的基本方法,包括折线图、柱状图、条形图、饼图、散点图和箱线图6种常见图表。详细讲解了每种图表的绘制步骤:从导入库、设置中文字体、创建画布,到数据准备、图表绘制(包含颜色、标签、网格线等参数设置),最后展示图表。特别说明了plt.show()在不同环境下的必要性,并提供了组合图绘制方法。通过12个月份的随机销售数据和学生成绩数据,演示了如何实现数据可视化分析,包含异常值检测等功能。

2026-03-02 15:03:36 1111

原创 Python 数据分析 · Pandas 核心二 “DataFrame” (2)

本文介绍了Python Pandas中DataFrame的描述性统计和常用操作。全文围绕 “学生成绩统计” 实例展开,主要讲解了:1)创建包含学生成绩的示例DataFrame;2)描述性统计方法(describe、count、mean、var等)的使用和注意事项;3)常见操作如值判断(isin)、缺失值处理(isna、dropna)、数据筛选、去重(drop_duplicates、unique)和替换(replace);4)数据添加(按列/行)和排序(sort_values)方法。

2026-02-27 15:36:29 1119

原创 Python 数据分析 · Pandas 核心二 “DataFrame” (1)

本文介绍了Python Pandas库中DataFrame的核心概念和基本操作。主要内容包括:1)DataFrame的创建方法,通过Series和字典两种方式;2)DataFrame的基本属性如索引、列名、形状等;3)数据访问方法,包括显式索引(loc)、隐式索引(iloc)以及head/tail等常用操作;4)数据筛选和抽样技巧。文章通过多个代码示例演示了如何创建、操作和分析二维表格数据,为Python数据处理提供了实用指导。

2026-02-26 08:00:00 931

原创 Python 数据分析 · Pandas 核心一 “Series” (2)

本文介绍了Python Pandas中Series的描述性统计方法。主要内容包括:1)常见统计指标如均值、中位数、标准差等计算方法;2)数据分布特征分析包括偏度和峰度;3)数据清洗操作如空值处理、去重和抽样;4)补充操作如索引获取、排序等。通过代码示例演示了describe()、count()、mean()等核心函数的使用,并解释了统计指标的含义。文章还涵盖了频数统计、缺失值判断等实用技巧,为数据分析提供了全面的Series操作指南。

2026-02-25 00:09:10 1001

原创 Python 数据分析 · Pandas 核心一 “Series” (1)

本文介绍了Python中Pandas库的Series数据结构及其基本操作。主要内容包括:1)Series的组成结构(名称、索引、数值);2)四种创建方式(列表、字典、已有Series);3)Series的常用属性(index、values、name等);4)数值访问方法(显式/隐式索引、head/tail函数)。文章通过代码示例详细演示了Series的创建、属性查看和元素访问操作,为初学者提供了Pandas入门指导。

2026-02-24 19:32:54 1308

原创 Python 数据分析 · Numpy 科学计算 (2)

本文介绍了Python数据分析中常用的NumPy统计函数和数组操作方法。主要内容包括:1) 基础统计函数如求和、均值、方差、标准差等;2) 比较函数如greater、less、equal等;3) 逻辑运算函数如logical_and、logical_or;4) 数组排序、去重、拼接、分割等操作;5) 数组形状调整方法reshape。通过示例代码演示了如何对列表、元组和数组进行统计分析、条件筛选和维度变换。这些功能为数据预处理和科学计算提供了基础工具支持。

2026-02-22 23:56:07 1547

原创 Python 数据分析 · Numpy 科学计算 (1)

本文介绍了Python中NumPy库的科学计算功能,主要包括:1.数组算术运算(加减乘除、幂运算等)及广播机制;2.矩阵乘法规则与实现;3.常用数学函数(开方、幂运算、对数、三角函数、取整等)的使用方法。通过示例代码展示了如何对一维和二维数组进行各种数学运算,并详细说明了广播机制的工作原理。文章还特别强调了数组形状匹配的重要性以及空值处理的注意事项,为Python科学计算提供了实用指导。

2026-02-20 22:58:10 1435

原创 Python 数据分析 · Numpy 的核心 “多维数组 ndarray”

本文总结了Python中Numpy库的多维数组ndarray的核心知识。ndarray具有多维性、同质性和高效性三大特性,支持从0维到高维的数据存储。文章详细介绍了多种创建数组的方法:手动输入、预定义形状填充、基于数值范围生成、特殊矩阵生成和随机数组生成。同时讲解了数组属性函数(如shape、ndim、size等)和数据类型设置。在索引与切片部分,说明了基本索引、行列索引、slice函数切片和布尔索引的使用方法。通过丰富的代码示例展示了各种操作的实际应用,为Python科学计算提供了实用参考。

2026-02-18 23:43:53 1205

原创 Python 数据分析 · 进入自动化处理的关键入门信息

本文介绍了Python在数据分析中的实战应用,对比了Excel和Python的数据处理能力差异。详细讲解了数据分析工具Anaconda、Jupyter Notebook和PyCharm的安装配置及使用技巧。重点介绍了Python数据分析四大核心库:NumPy(数值计算)、Pandas(数据处理)、Matplotlib(数据可视化)和Seaborn(高级可视化),并通过代码示例展示了各库的基本使用方法。文章为Python数据分析初学者提供了全面的工具准备和入门指导。

2026-02-17 22:15:50 1310

原创 Python 数据分析 · 从简单的 Excel 开始

本文介绍了数据分析的基础知识,包括数据分类(定性数据与定量数据)、统计指标(集中趋势、离散趋势和分布形态)、异常值处理方法以及数据分析的基本步骤。同时概述了Excel在数据分析中的应用,详细列举了常用函数的功能和使用方法,如sum()、average()、IF()等,为Python数据分析实战提供了基础知识准备。

2026-02-16 22:37:49 1214

原创 Python 装饰器 · 用函数玩转函数 + 登录注册系统的简单模拟

本文介绍了Python中的装饰器概念及其应用。装饰器本质上是一个闭包函数,用于在不改变原函数功能的前提下为其添加新特性。文章详细讲解了装饰器的基本格式和使用方法,包括单装饰器和多装饰器的叠加应用,并指出装饰器的执行顺序规律。最后通过一个用户注册登录系统的实例,展示了装饰器在实际开发中的应用场景,包括用户信息封装、系统界面设计以及登录注册功能的实现。文章通过代码示例直观地演示了如何利用装饰器增强函数功能。

2026-02-15 23:53:15 969

原创 Python 匿名函数及函数递归

本文介绍了Python中匿名函数lambda及相关常用函数的用法。主要内容包括:1)lambda匿名函数的定义语法和简单示例;2)zip()函数用于合并可迭代对象;3)locals()和globals()获取作用域变量;4)sorted()函数实现自定义排序;5)filter()函数进行条件筛选;6)map()函数实现元素映射;7)递归函数的基本概念和使用注意事项。通过多个代码示例展示了这些函数的具体应用场景。

2026-02-14 15:53:15 1125

原创 Python 内置函数 · 其他

本文介绍了Python内置函数中的"其他"部分,包括字符串代码执行、输入输出、内存操作、文件操作、模块导入、帮助文档和属性查看等功能。重点讲解了eval()、exec()、compile()等字符串代码执行函数的使用方法和注意事项,以及input()、print()、hash()、id()等常用函数。文章还涵盖了文件操作open()、模块导入import、帮助查询help()、调用判断callable()和属性查看dir()等实用功能,通过代码示例展示了这些内置函数的具体应用场景和使用方

2026-02-13 19:27:09 944

原创 Python 内置函数 · 迭代器、生成器相关

本文介绍了Python中的迭代器和生成器相关知识。主要内容包括:1)迭代器概念及其特性(单向遍历、惰性求值、内存高效),以及iter()、next()等内置函数的使用;2)生成器的定义与yield关键字的作用,展示如何创建生成器函数;3)各种推导式(列表、集合、字典)和生成器表达式的语法及应用示例。通过代码演示了迭代器和生成器的实际使用方式,并比较了它们与传统循环和普通函数的区别。这些特性能够有效简化代码并提升内存使用效率。

2026-02-12 22:27:17 995

原创 Python 内置函数 · 面向对象相关

本文介绍了Python中类型检查与对象属性操作的相关方法。主要内容包括:1)类型检查函数type()、isinstance()和issubclass()的用法,用于判断对象类型和类继承关系;2)对象属性操作方法hasattr()、getattr()、setattr()、delattr(),以及vars()和dir()函数的使用;3)继承与封装相关特性,如super()调用父类方法、callable()判断可调用性、@property装饰器管理属性访问权限。通过多个代码示例演示了这些内置函数在类操作中的实际应

2026-02-11 21:02:37 668

原创 Python 内置函数 · 反射、作用域相关

本文介绍了Python中反射相关和作用域相关的内置函数。反射部分包括:1) getattr()动态获取对象属性/方法;2) setattr()动态修改/创建属性;3) delattr()动态删除属性;4) hasattr()判断属性是否存在。作用域部分讲解了全局/局部变量的区别,闭包的概念及作用,以及global和nonlocal关键字的使用方法。通过代码示例演示了如何动态操作类属性和方法,以及变量作用域的控制技巧,帮助理解Python中反射机制和作用域管理的核心概念。

2026-02-10 23:55:33 1402

原创 Python 内置函数 · 基础数据类型相关

本文介绍了Python内置函数的分类和使用方法。主要包括:1)数据类型转换函数(int,float,bool等);2)进制转换函数(bin,oct,hex);3)数学运算函数(abs,divmod,round等);4)字符串处理函数(str,format,bytes等);5)序列操作函数(list,tuple,reverse等);6)集合操作函数(set,dict,len等)。文章详细说明了各类函数的用途、参数和返回值,并提供了丰富的代码示例,如数字类型转换、进制转换、字符串格式化等操作演示。这些内置函数可

2026-02-09 20:48:46 1415

原创 Python 函数基础:从入门到实战

本文介绍了Python函数的基础知识,包括函数定义、参数传递和返回值处理。主要内容有:1)函数概念及基本语法;2)形参(位置参数、默认值参数、动态参数等)和实参(位置参数、关键字参数)的使用方法;3)返回值处理规则(默认返回None,可返回单值或多值);4)通过咖啡厅点单系统的实际案例,展示了函数定义、调用、参数传递和返回值处理的综合应用。案例中创建了菜单展示、核对和点单三个功能函数,演示了函数封装、嵌套调用等特性,体现了函数在代码复用和模块化开发中的优势。

2026-02-08 23:40:21 715

原创 Python 基础 · 字符编码与文件操作全解析

本文介绍了Python基础学习中的字符编码和文件操作两个重要内容。在字符编码部分,详细讲解了ASCII、GBK、Unicode和UTF-8等编码标准的演变过程及其特点,并通过代码示例演示了编码与解码的具体操作。在文件操作部分,系统讲解了文件打开模式、路径设置、读写方法以及文件的删除和修改等操作,特别强调了文件操作完成后必须关闭文件的重要性,并推荐使用with语句来自动管理文件资源。文章通过丰富的代码示例展示了各类文件操作的实际应用,为Python初学者提供了实用的文件处理指南。

2026-02-07 10:30:00 596

原创 Python 基础 · 条件与循环全解析

本文介绍了Python中的条件判断和循环语句。条件判断包括if、if-else和if-elif-else结构,通过比较运算、逻辑运算和成员运算进行真假判断。循环语句包括while和for循环,用于重复执行代码。文章通过天气提醒和数字游戏等示例,演示了条件判断和循环的实际应用,并详细说明了break、continue、range()等关键概念的使用方法。最后还验证了不同数据类型的可迭代性,为Python初学者提供了实用的编程指导。

2026-02-06 10:30:00 926

原创 Python 基础 · 数据类型全解析(3)

本文详细介绍了Python中的集合和字典两种数据类型。集合是无序不重复序列,支持交并差等运算,元素必须可哈希;字典是键值对集合,键必须可哈希而值可以是任意类型。文章讲解了两种数据类型的创建、增删改查操作,并展示了集合运算和字典嵌套的实例。集合适用于去重和数学运算场景,字典则适合存储键值映射关系。通过学习这两种数据类型,可以更灵活地处理Python中的复杂数据结构。

2026-02-05 19:50:36 990

原创 Python 基础 · 数据类型全解析(2)

本文详细讲解了Python中的列表和元组两种数据类型。列表是有序可变序列,支持增删改查、索引切片、排序等操作,元素可以是任意类型。元组是有序不可变序列,特性与列表类似但不支持修改操作,需要注意单元素元组的特殊定义方式。文章通过代码示例演示了列表的生成、遍历、增删改查、排序等操作,以及元组的定义、索引切片等特性。两种数据类型都是Python编程中常用的重要数据结构。

2026-02-04 19:32:06 886

原创 Python 基础 · 数据类型全解析(1)

本文介绍了Python中常见的数据类型及其操作方法。主要内容包括:1.数字类型(整数、浮点数、复数)及其算术运算、比较运算和赋值运算;2.字符串类型的基本操作(连接、重复、强制转换)以及格式化、索引、切片、大小写转换、切割替换、查找判断等高级操作;3.布尔值类型及其在逻辑运算和成员运算中的应用。文章通过大量代码示例详细展示了各种数据类型的具体用法,并特别说明了格式化字符串的三种方法(%格式化、format方法和f-string)以及字符串切片的正反索引技巧。

2026-02-03 23:49:32 1464

原创 Python 入门 · 注释、输入输出与变量基础

本文介绍了Python入门基础知识,主要包括:1)注释的使用方法(单行和多行);2)输入函数input()获取用户输入;3)输出函数print()的多种用法;4)常见数据类型(字符串、整型、浮点型等)及其类型检查;5)字面量和变量的概念及变量命名规则。通过具体代码示例展示了各知识点的实际应用,为Python初学者提供了清晰的基础语法指导。

2026-02-02 21:22:41 452

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除