自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 Python依赖冲突排查工具pipdeptree介绍

pipdeptree 是一个用于可视化 Python 环境依赖树、诊断冲突的命令行工具。本文介绍了pipdeptree的使用方法和优势,并提供示例效果。

2025-09-12 14:00:00 727

原创 CUDA升级导致Conda环境兼容性问题解决方案

升级CUDA版本后,历史Conda环境可能因驱动路径变更导致兼容性问题(如CUBLAS报错)。本文介绍了临时通过环境变量指定CUDA版本、永久修改bash配置、创建切换脚本、符号链接全局切换等解决方法。

2025-08-29 10:00:00 1628

原创 时间序列预测任务中时间字段特征工程30+示例

本文将系统介绍时间字段的特征拓展方法,包括基本信息提取、周期性编码、时间间隔计算、节假日处理以及基于时间的统计特征构建。

2025-08-28 10:00:00 1827

原创 Python JSON操作详解

本文介绍了Python中处理JSON数据的常用方法与工具,包括JSON文件读写、数据类型映射、字符串转换、命令行工具、性能与大数据处理等方面。

2025-08-22 10:00:00 1286

原创 pip国内镜像源及配置方法

本文介绍了国内常用的PyPI镜像源及配置方法。推荐清华大学、阿里云等7个主流镜像源,并详细说明临时/永久配置方案。文章还包含镜像源选择建议、速度测试方法及恢复默认配置的操作指南等。

2025-08-21 15:00:00 3991

原创 PCA降维介绍

PCA降维广泛应用于数据预处理、特征提取、数据可视化等领域。本文将从核心思想、动机、实现步骤、代码到注意事项,介绍PCA的使用方法与适用场景。

2025-08-21 10:00:00 751

原创 Pandas数据结构DataFrame详解

本文介绍了Pandas中DataFrame的核心功能,包括创建、基本操作(查看、选择、过滤、修改)、常用功能(统计、缺失值处理、排序、分组聚合、应用自定义函数、数据结构转换)、合并与分割方法等,并提供了代码示例。

2025-08-19 10:00:00 2197

原创 Python中3种语言检测库

Python中有多种语言检测的库,本文档介绍了三个主流语言检测库:langdetect、langid和cld2/pycld2。

2025-08-18 10:00:00 1057

原创 Python的6种列表分批方法

本文介绍了python对列表的6种分批方法:列表推导式、生成器、zip + 迭代器、numpy.array_split、递归、more_itertools.chunked。详细介绍了如何使用、展示了示例代码和不同应用场景如何选择。

2025-08-13 14:30:00 1009

原创 Python常用的5种中文分词工具

本文介绍了五种常用的中文自然语言处理工具:jieba、jiagu、snownlp、thulac和LAC,重点讲解了它们的分词功能及其他核心特性,并提供了相关示例代码。

2025-08-12 12:00:01 1119

原创 Python用Flask封装API及调用介绍

Flask是一个轻量级的Python Web框架,适合用来快速构建RESTful API。本文介绍使用Flask封装API的几种常见方式,包括GET请求、POST表单和POST JSON,并提供相应的调用示例。

2025-08-11 10:00:00 1367

原创 Python WSGI HTTP 服务器 Gunicorn介绍

Gunicorn是一个纯Python的WSGI HTTP服务器,用于运行Python Web应用程序。本文介绍了Gunicorn的使用方法的注意事项。

2025-08-10 10:00:00 779

原创 Tmux终端复用器介绍

Tmux是一个终端复用工具,允许用户在一个终端窗口中创建多个会话、窗口和面板。本文介绍了tmux的主要功能、基本操作、高级功能等。Tmux适合远程工作,能保持断开连接后的进程运行,提高工作效率,帮助你更好的操作服务器等。

2025-08-09 10:00:00 942

原创 Python操作关系型数据库

本文介绍了PyMySQL库的基本使用方法,包括数据库连接配置、表操作和CRUD操作示例。提供了实用代码片段和性能优化建议。

2025-08-08 10:00:00 1281

原创 Python中argparse模块命令行参数解析介绍

本文介绍了python使用argparse解析命令行参数,包括自动生成帮助和使用信息、位置参数和可选参数介绍、参数类型和验证、子命令系统、自动错误处理等部分,包含功能解释及示例代码。

2025-08-07 10:00:55 864

原创 Python分块读取大型Excel文件

传统方法在处理大型Excel文件时可能面临内存不足的问题。本文通过分块读取,适合处理数百MB甚至GB级别的Excel文件。

2025-08-05 14:51:40 465

原创 Python中经纬度距离计算方法

本文介绍了在python中计算经纬度距离的几种方法:geopy(Vincenty、Karney)、Haversine、pyproj(椭球模型投影计算)、平面近似法(小范围快速估算)等。同时介绍了针对加密坐标系如何使用工具转换。

2025-08-05 09:36:04 1380

原创 Python LRU缓存应用与示例

本文介绍了LRU思想,用Python实现基于LRU的缓存策略,并提供了不同场景下的使用示例。适用于高频读取场景,帮助开发者提升缓存效率,减少重复计算与IO开销。

2025-08-01 15:28:39 1060

原创 Python Typing 模块类型提示功能

本篇介绍了Python的typing模块的类型提示功能,包括用途、基本功能、高级功能及应用示例代码等。类型提示可提升代码可读性、支持静态类型检查、增强IDE功能,并作为代码文档的一部分。

2025-08-01 09:51:01 1091

原创 Faker虚假数据生成功能

Faker能快速生成大量逼真的虚假数据,如姓名、地址、邮箱等等,支持多种数据类型和领域,可定制化数据生成规则,多语言支持。本文列举了Faker的常用基本功能,并提供示例代码。

2025-07-31 16:46:52 1089

原创 图像增强5种遮挡混合变换方法示例

本文介绍如何使用Albumentations对图像进行遮挡混合变换增强,共介绍5种遮挡混合变换方法,同时提供了对应的示例代码和应用场景建议。

2025-07-31 11:52:42 1143

原创 图像增强3种空间变换方法示例

本文介绍如何使用Albumentations对图像进行空间变换增强,共介绍3种空间变换方法,同时提供了对应的示例代码和应用场景建议。

2025-07-30 11:36:16 779

原创 图像增强12种颜色变换方法示例

本文介绍如何使用Albumentations对图像进行颜色变换增强,共介绍12种颜色变换方法,同时提供了对应的示例代码和应用场景建议。

2025-07-30 10:02:34 1223

原创 图像增强7种噪声模糊变换方法示例

本文介绍如何使用Albumentations对图像进行噪声模糊变换增强,共介绍7种噪声模糊变换方法,同时提供了对应的示例代码和应用场景建议。

2025-07-29 17:24:00 849

原创 图像增强11种几何变换方法示例

本文介绍如何使用Albumentations对图像进行几何变换增强,共介绍11种几何变换方法,同时提供了对应的示例代码和应用场景建议。

2025-07-29 14:58:17 1194

原创 Python中如何用os模块操作文件与目录

本文介绍了Python标准库中的os模块,介绍了其操作文件与目录的使用方法并提供了代码示例。包括执行各种操作系统级别的任务,如创建/删除目录、遍历文件系统、管理文件路径等。

2025-07-24 10:37:50 919

原创 Python常用日期时间处理技巧及应用

本文介绍Python时间处理的核心方法,涵盖datetime模块的基础操作、时间格式化转换、时间差计算技巧和实用场景解决方案,帮助开发者高效处理各类时间相关需求,提高数据处理效率。

2025-07-22 10:40:37 1320

原创 Python的heapq模块,用最小堆高效维护动态数据的最小值

本文介绍了Python中的heapq模块,它通过堆数据结构实现高效的最小值操作,适用于优先队列和Top-K问题。介绍了堆的4个功能(heapify、heappush、heappop、nsmallest/nlargest),并通过实际示例介绍了应用场景。帮助开发者灵活选择数据结构。

2025-07-18 09:26:15 394

原创 Conda国内镜像源及配置方法

本文附8个国内Conda镜像源,介绍临时使用方法和永久配置方法以及对仓库简单说明,供开发过程中方便取用。

2025-07-17 09:56:21 5175

原创 Python中如何精确统计函数执行时间

在开发中,我们常需要了解代码的执行效率。本文将介绍Python中统计函数执行时间的多种方法及其适用场景和注意事项。

2025-07-16 11:44:18 1040

原创 Python中set集合操作详解

Python集合(Set)是一种无序、可变的容器数据类型,具有元素唯一性(自动去重)的特点,支持丰富的数学集合运算。本篇介绍了Python集合的四大基础操作、多重集合操作、性能、限制、实际应用及示例介绍。

2025-07-16 10:00:00 836

原创 Python去除列表重复元素并保持原顺序

Python使用collections.OrderedDict去除列表重复元素并保持原顺序的示例及解释说明。

2025-07-15 14:14:40 417

原创 Pandas读写Excel文件

本篇介绍Pandas读写Excel文件基本操作,并提供示例代码,帮助快速掌握Pandas与Excel的交互方法。

2025-07-15 09:59:47 1369

原创 docker基础命令解释

本文介绍了Docker的基本操作和常用命令:镜像下载、容器管理、镜像构建、推送流程,附带部分参数说明和示例,帮助快速参考掌握。

2025-07-14 17:33:10 942

原创 FastText词向量、分类、语言检测等功能介绍

FastText可以用于词向量生成、文本分类、语言识别等任务,核心优势是简单高效,适合资源受限的应用场景。本文探讨FastText的技术原理、训练示例,介绍如何利用FastText处理任务,为NLP实践提供参考。

2025-07-14 10:22:26 1160

原创 FastText安装报错解决方案

你是否遇到包安装报错“Microsoft Visual C++ 14.0 or greater is required”?如果不想安装 Microsoft C++ Build Tools,可以尝试安装预编译 Wheel或使用Conda解决。

2025-07-12 18:28:07 316

原创 Python使用AC自动机实现字符串匹配

在任务中常常遇到字符串搜索或匹配的需求,当涉及到海量关键词时,往往又会遇到效率问题,可以尝试使用AC自动机(pyahocorasick ),或许可以帮助解决这些问题。

2025-07-12 12:16:29 562

原创 Python中使用matplotlib绘制9类26种图表示例

本文介绍了matplotlib的基本功能,并列举了常见图表的绘制方法。本文将示例图表按其适用场景分为9大类共计26种,并对每种图表提供了绘制样例代码及图像输出。

2025-07-11 16:44:43 1489

原创 分类任务中的评估指标分析与选择

本文介绍了分类任务中的基本评估指标、阈值无关指标、多分类整体评估指标、类别不平衡指标等常见指标,概括了指标的含义、计算方式、适用场景等内容。

2025-07-11 10:17:21 1263

原创 Python中的sort()和sorted()用法

Python提供了两种排序方法:list.sort()和sorted()。两种排序分别如何使用?它们的原理又是什么?

2025-07-10 11:56:00 1483

自然语言处理-汉语词性对照表-词性编码与名称对应关系

内容概要:本文档为《汉语词性对照表》,列出了汉语中不同词性的编码及其对应的名称。 适合人群:语言学研究者、自然语言处理工程师、汉语教师及相关从业人员。 使用场景及目标:作为汉语分词和词性标注的基础参考资料;用于构建汉语语法分析工具或系统;辅助汉语教学,帮助学生理解汉语词汇分类。

2025-08-11

自然语言处理-中文百家姓-数据集

该数据集为中国传统《百家姓》中的姓氏数据,包含常见及稀有姓氏,格式为.txt;适用学术研究者、技术开发者、教育工作者;适用文化研究、NLP模型训练、数据可视化等应用场景。

2025-07-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除