- 博客(57)
- 收藏
- 关注
原创 pandas | 数据中缺失值的检测、统计与处理
本文介绍了数据缺失的概念及其在不同环境中的表现形式(如Null、None、NaN),并详细讲解了pandas中缺失值的检测与处理方法。检测方法包括isnull()、notnull()和sum()统计;处理方法分为删除法(dropna)和替换补齐法(fillna)。删除法可整行/列删除缺失值,替换法支持用均值、中位数或特定值填充。文中通过实例演示了具体操作步骤,并强调应根据实际情况选择合适方法处理缺失值,为后续数据分析与建模提供完整数据基础。
2025-12-21 12:59:08
759
原创 pandas | 查看数据特征的常见属性及方法
本文介绍了使用pandas读取Excel数据后,通过DataFrame属性和方法查看数据基本情况的操作。主要包括:1)使用shape获取数据行列数;2)通过dtypes查看数据类型;3)利用info()获取数据摘要;4)使用describe()生成描述性统计;5)通过size查看元素个数;6)用ndim获取数据维度;7)使用T属性实现数据转置。这些方法可帮助快速了解数据集的大小、类型、分布等基本信息,为后续数据分析提供参考。
2025-12-21 12:35:26
651
原创 python3 | XPath 安装及导入方法
本文介绍了在Windows系统下Python3环境中XPath的安装与使用方法。XPath通过lxml库实现,安装方法包括直接使用pip命令安装(推荐)或下载whl文件安装两种方式。文章详细说明了两种安装方法的具体操作步骤,并提供了环境变量配置建议。同时介绍了XPath的两种导入方式:通过lxml.etree或lxml.html导入,并给出了相应的代码示例。本文为使用XPath进行网页解析和文本提取提供了实用的安装和导入指南。
2025-12-20 22:27:57
895
原创 mysql | 数据表中列(字段)的添加、修改和删除
本文介绍了MySQL表中对列的常用操作:添加、修改和删除列。添加列时需注意数据类型规范,如varchar必须指定长度;修改列可通过modify(仅改类型)或change(可改列名和类型)两种方式;删除列使用drop命令。文章通过实例演示了各操作的具体语法和常见问题解决方法,特别强调了数据类型定义中的注意事项,为MySQL表结构维护提供了实用参考。
2025-12-20 21:53:29
1055
原创 mysql | 复制表结构和数据
摘要:MySQL复制表结构和数据有三种方式:1)仅复制表结构到新表(使用CREATE TABLE新表LIKE原始表或带WHERE 1=2的SELECT);2)同时复制表结构和数据到新表(直接SELECT全表数据);3)将数据复制到已有表,分为全字段复制(要求表结构一致)和部分字段复制(需指定对应字段)。每种方法都支持通过WHERE条件限制复制数据量,操作时需注意字段约束条件。
2025-12-20 21:02:27
980
原创 mysql | 环境变量问题及其配置方法详解
MySQL安装后若未配置环境变量,在cmd中运行mysql命令会报错:不是内部或外部命令。解决方法有两种:一是每次使用前手动进入MySQL安装目录的bin文件夹执行命令;二是配置环境变量(推荐)。配置方法为:系统属性→环境变量→系统变量Path→添加MySQL的bin目录路径。配置完成后需重启cmd验证,输入mysql--version显示版本即表示成功。环境变量配置能简化操作流程并避免潜在问题,建议安装时勾选自动配置选项。
2025-12-20 19:15:37
684
原创 mysql | limit 用法详解及注意事项
摘要:MySQL中的LIMIT用于限制SELECT查询返回的行数,常用于分页查询。基本语法为LIMIT [offset,] count,其中offset表示跳过的行数(默认为0),count表示获取的行数。文章介绍了四种常见用法:获取前N行记录、获取最大值的记录、获取指定范围记录(如第3-5行)以及分页查询实现。特别指出LIMIT X,-1这种获取X行后所有记录的方式已不可用,会报语法错误,建议使用足够大的正数代替。最后强调LIMIT参数必须是非负整数,不能为表达式。
2025-12-20 16:32:01
1170
原创 10 个 word 实用小技巧,值得收藏备用!
本文分享了10个实用的Word操作技巧:1)5种方框勾叉输入方法;2)汉字加拼音;3)文本添加着重号;4)添加删除线;5)简繁体转换;6)文档加密与解密;7)西文单词换行设置;8)快速定位页面;9)插入数学公式;10)删除顽固空白页的两种方法。这些技巧涵盖了文字处理、格式调整、文档安全等常见需求,操作步骤详细,适合日常办公收藏使用。
2025-12-18 22:21:22
422
原创 Excel | .xls 与 .xlsx 文件的区别及使用 Excel 打开 CSV 文件出现乱码的解决办法
摘要:本文介绍了Excel文件格式差异及CSV文件处理方法。xls文件(Office 2007前版本)最大支持65536行256列,而xlsx文件(2007及以后版本)支持1048576行16384列,且占用空间更小。针对CSV文件乱码问题,提供了通过Excel数据导入功能(选择UTF-8编码和逗号分隔符)的正确打开方式。
2025-12-18 22:01:01
1332
原创 mysql | 常见日期函数使用及格式转换方法
MySQL提供了多种日期类型(date,time,year,datetime,timestamp)和日期处理函数。常用日期获取函数包括current_date()、current_time()和now(),分别用于获取当前日期、时间和日期时间。日期转换函数CONVERT()可将datetime转为date类型,DATE_FORMAT()则支持自定义日期格式输出,通过%Y、%m等格式符组合实现灵活转换。这些函数为日期数据的存储、处理和显示提供了便利。
2025-12-18 19:48:09
816
原创 python | 将字典类型数据保存成 json 文件及读取 json 文件方法
json.dump():将数据以 json 的数据类型写入文件中。json.load():从 json 文件中读取数据,返回字典格式数据。
2025-12-15 14:00:00
591
原创 python | requests爬虫如何正确获取网页编码?
代码中建议优先选择 requests 自带的 response.apparent_encoding,更为精准。
2025-10-19 17:07:19
799
原创 python I 本地 html 文件读取方法及编码报错问题详解
本地 html 读取编码问题解决方法有二:一是指定正确的编码格式读取本地 html 文件;二是抛开编码不管,直接采用二进制文件读取本地 html 文件。
2025-07-26 19:19:11
1022
原创 python | 输入日期,判断这一天是这一年的第几天
datetime.date:表示日期的类,常用属性有year、month、day。两个 datetime.date 时间类型数据相减,返回两个日期间隔的天数。
2025-03-17 21:17:01
1029
原创 python | xpinyin,一个可以将汉字转换为拼音的库
xpinyin 是一个第三方 python 库,可以将汉字(中文)转换成拼音,仅需几行代码即可。
2025-01-15 18:45:00
814
原创 python | 2行命令解决pip模块不存在问题
执行 pip 更新命令时,有出现失败或警告,然后再次执行pip命令报错pip模块不存在,可直接按顺序执行以下2条命令,即可完成pip修复。
2024-09-13 16:00:00
3691
原创 python | 字符串编码问题怎么破
python字符串常见两种类型:str和 bytes类型。str表示Unicode字符,bytes表示二进制数据。两者之间转换使用:encode()和decode()方法。
2024-08-20 22:32:24
1084
原创 python—openpyxl操作excel详解
openpyxl属于第三方模块,在python中用来处理excel文件。可以对excel进行的操作有:读写、修改、调整样式及插入图片等。但只能用来处理【 .xlsx】 后缀的excel文件。
2023-10-24 21:00:31
10320
1
原创 python-字符串去掉空格的常见方法
去掉字符串的全部空格、字符串连续空格保留一个等,都需要结合其他的方法来实现。以下简单归纳了去除字符串空格的3种应用场景及相应处理方法,可供参考。
2023-09-18 21:16:00
5002
原创 python | 将pdf文件转换为图片,这一招就够了
pdfplumber 将 pdf 转换为图片的使用方法很简单,代码也不复杂。可能较为麻烦的就是,对本地环境有一定的要求,需要安装和配置。
2023-08-28 09:23:23
7624
原创 python中——requests爬虫【中文乱码】的3种解决方法
python中requests爬虫【中文乱码】问题,是最常遇到的问题,对于初学者来说,是很困恼的。本文将详细说明,python中使用requests库编写爬虫程序时,出现【中文乱码】的原因,及常见3种解决办法。
2023-07-24 13:23:14
15193
3
原创 python | 巧用字典get方法实现词频统计、关系映射
python字典内置很多函数和方法,其中get()方法是最基础、常见的查询方法,可灵活运用于多个场景。
2022-08-11 21:01:41
3043
世界各个国家或地区国际域名缩写
2024-04-28
mysql环境安装详细教程-最简单的MySQL安装方法
2023-09-10
ImageMagick安装及报错解决办法
2023-08-27
python提取pdf中表格数据并保存到excel中
2023-08-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅