python与大数据分析-CSDN博客

原创关于2022年-2024年个人公众号总结

从2019年到2025年也有6个年头了，本来想矫情一下，既没有矫情的资本，也没有矫情的水平，还是如流水账般对自己近三年的努力做一下总结吧。之所以是这三年，是因为最初的前三年每年都会总结一下，这几年里孩子也长大了，工作换了，连工作内容也换了，代码也不怎么写了，自己的技能当然一如既往的停留在初学状态，但初学不等于不学，已经成了技术人的唯一执念了。这三年里基本还是以Python为主，偶尔搞一下GIS和数...

2025-03-04 00:16:06 752

原创关于2021年个人公众号总结

兜兜转转，又过了一年，2022年来了，自己又老了一岁，娃也长大了一岁，无聊的年底迎来了一波又一波的数字化考核，假的让人瞠目结舌。人生啊，处于上有老下有小的境地，工作呢，在甲乙丙丁戊各方中周...

2022-01-04 15:20:44 1410 1

原创关于2020年个人公众号总结

年关将近，又到了一年一度的总结时候，本来写的好好的总结材料，结果没保存好，只好提笔重写写到哪里算哪里了。2020年是特别的，一场突如其来的新冠疫情从武汉爆发迅速席卷到全国，然后全世界也沦陷了，几乎影响和改变了每个人的生活，时至今日还在我们的生活中时不时的制造一些麻烦。疫情深刻地改变了全球政治、经济和人们的生活。对中国来说,中国方案和中国抗疫行动为世界在灾难面前保持了一份稳定的信心。也正因为中国方案和行动卓有成效,才迎来中国经济的稳步复苏和国内生活秩序的迅速恢复。这一成绩点亮了世界,也点亮了人们的内心。也

2020-12-30 00:35:32 1070 1

原创关于我的公众号和公众号文章索引，请大家关注，谢谢

2019年公众号文章索引。有兴趣，大家可以关注，谢谢。目前差不多将近90篇了，有质量高的有质量低的，有懈怠的时候也有如期交付的时候，不管怎么样，算是坚持下来了，希望明年会更好。总的来说，搞技术要沉下来，不求尽如人意，但求问心无悔。链接太难搞了，偷偷懒，只贴标题和分类了。文章类型关于大数据运维能力的一些思考 IT业界去IOEorNot? I...

2020-02-04 15:25:14 1212

原创当pyecharts遇到中国式大屏：pyecharts 的中国式大屏改造记

它承载的不仅是数据，更是一种 "运筹帷幄" 的治理美学，每个图表都肩负着叙事使命，如同古画中的散点透视，让观者在宏大叙事中捕捉细微变化。这种 "够用就好" 的设计哲学，在通用场景中是优势，却在面对中国式大屏时显得力不从心 —— 就像让素雅的水墨画突然跳进浓墨重彩的工笔长卷，线条、配色、气韵都需要彻底重塑。当 pyecharts 的代码逻辑遇上中国式大屏的美学体系，本质上是两种思维的对话：一种是程序员的功能优先，一种是大国叙事的气场至上。而改造的过程，正是在代码与美学的缝隙里，寻找数字时代的治理表达。

2025-08-20 09:37:35 820

原创 2024 最火的数据可视化技巧：用 pyecharts 做中国统计地图，颜值吊打原生图表

它的核心魅力恰恰在于高度可定制的参数体系 —— 就像给相机调光圈、快门能拍出不同风格的照片，修改 pyecharts 的配置项，能让同一份数据呈现出完全不同的视觉效果。尤其在地理数据展示上，pyecharts 的地图模块支持中国省市县多级区划，能轻松实现数据与地理区域的绑定，是统计分析、政务汇报、学术研究中展示地域数据的热门工具。关于随时间序列变化的数据，在pyecharts的示例中是有的，不过我们不需要那么复杂的，在此做了精简，完全可以参照之前的方式对地图再进行美化，这里就不再赘述了。

2025-08-07 10:17:13 721

原创 2025高质量数据集实践指南（1.0）-大数据技术标准推进委员会

数据要素价值实现的载体：数据要素需形成高质量数据集，才能在市场中高效流通和交易，释放价值。如行业专用高质量数据集，经清洗、标注等处理，成为企业专属数据资产，用于精准营销、风险评估等业务，提升数据要素商业价值。人工智能发展的物质基础：数据要素为人工智能提供原始素材，大量多样的数据要素经处理成高质量数据集，满足人工智能模型训练需求，推动人工智能技术创新和应用拓展。促进数据要素有序流通：通过建立数据产权、交易规则，数据治理推动数据要素合规高效流通，为高质量数据集建设提供丰富数据来源，促进数据要素市场发展。

2025-07-25 15:12:45 1037

原创＜span class=“js_title_inner“＞2025高质量数据集实践指南（1.0）-大数据技术标准推进委员会＜/span＞

数据要素价值实现的载体：数据要素需形成高质量数据集，才能在市场中高效流通和交易，释放价值。如行业专用高质量数据集，经清洗、标注等处理，成为企业专属数据资产，用于精准营销、风险评估等业务，提升数据要素商业价值。人工智能发展的物质基础：数据要素为人工智能提供原始素材，大量多样的数据要素经处理成高质量数据集，满足人工智能模型训练需求，推动人工智能技术创新和应用拓展。促进数据要素有序流通：通过建立数据产权、交易规则，数据治理推动数据要素合规高效流通，为高质量数据集建设提供丰富数据来源，促进数据要素市场发展。

2025-07-25 15:12:45 262

原创用pyinstaller打包python应用

PyInstaller 是一个流行的第三方 Python 库，用于将 Python 程序打包成独立的可执行文件（如。图像分类和检测一体化平台系统的打包过程，当然中间经过了几十版的编译，还是有些小瑕疵，后面再慢慢完善吧。打包后的程序可以在没有安装 Python 解释器和相关依赖的目标机器上直接运行。PyInstaller版本为 6.13.0。Python 版本为 3.12.0。第一步，清除历史遗留打包文件。生成基础 SPEC 文件。替换 SPEC 文件。第五步，复制其他文件。

2025-06-30 00:01:07 246

原创数据治理上的行转列需求——用Oracle实现

行转列分为两种，一种是把行的一个字段转为固定列，另外一种是行中的一个字段转为一列中的数据。LISTAGG：结果长度受限于 VARCHAR2 类型（默认 4000 字节），但可通过 CAST 转换突破限制。前几天在数据治理中，收到了一个不合理的需求，当然不合理归不合理，还是尽量满足这种不合理需求吧。WM_CONCAT：非官方函数，Oracle 不提供官方支持。WM_CONCAT：不支持 ORDER BY，结果顺序不确定。WM_CONCAT：在较旧版本（如 10g、11g）中可用。

2025-06-29 00:30:36 342

原创数据治理的利器——Oracle的V$SQL和PostgreSQL的pg_stat_statements

当然对于数据治理人员而言，看到的是另外一面，全库的血缘关系，不管是历史的还是正在进行的，尤其是当对业务系统一无所知的时候。现在的数据治理绝大多数都是片面的，无非是静态的元数据管理，基于ETL工具过程产生的血缘关系，或者是基于存储过程产生的静态血缘关系。对于DBA而言，Oracle 数据库中的 V$SQL 视图是一个至关重要的动态性能视图，它提供了关于 SQL 语句执行性能的关键指标，如执行次数、CPU 时间、逻辑读、物理读等，这些信息可以帮助 DBA 和开发人员识别性能瓶颈。

2025-06-28 08:13:52 836

原创关于目标分类预测界面、功能及代码框架

同时，系统会调用选择的模型进行预测，预测结果的结构化数据会输出到检测结果与位置信息区，同时在检测结果区的当前目标栏显示其类型和置信度，在目标位置栏分别显示当前标签预测情况。系统会读取该文件夹中的第一张图片，在左侧的图片预览区显示图片缩略图，在左侧的图片地址输入框中显示图片地址，在中间的媒体浏览区展示图片。：点击“打开摄像头”按钮，电脑的摄像头会开启，摄像头捕获的图片帧会在中间的媒体浏览区展示，同时系统会调用模型进行预测，将预测结果输出到媒体浏览区，检测结果区和检测结果与位置信息区不进行展示。

2025-05-09 00:01:10 1134

原创关于目标分类训练界面、功能及代码框架

在设置区，设置各项训练参数，包括迭代次数、批量大小、图像大小、等待轮数、初始学习率、是否保存模型权重、保存模型权重周期、训练设备（和目标检测一样，暂时只支持CPU）、工作线程数、优化器类型等。：点击相应的按钮，选择预训练模型文件（一般是models目录下的yolo8n-cls.pt 文件）和数据集路径（要训练的数据分类数据集根目录），选择后文件路径将显示在对应的主界面中。：目标分类训练利用标注好的图像数据训练分类模型，通过调整训练参数，使模型能够准确地对新的图像进行分类。

2025-05-08 07:40:38 922

原创关于目标分类数据集划分界面、功能及代码框架

最后，系统会在目标数据集图片文件夹建立训练集、验证集和测试集的子目录，并将划分好的图片文件移动到对应的子目录中。：目标分类数据集划分功能将目标分类的原始数据集划分为训练集、验证集和测试集，用于模型的训练、验证和评估，确保模型在不同数据集上的准确性和泛化能力。选择后，相应文件夹的全路径将显示在对应的主界面上。功能：打开文件选择对话框，让用户选择目标数据集图片文件夹，并将选择的路径显示在对应的标签上。功能：打开文件选择对话框，让用户选择源数据集图片文件夹，并将选择的路径显示在对应的标签上。

2025-05-07 07:15:38 1176

原创关于目标分类图像增强界面、功能及代码框架

点击“数据增强”按钮后，系统会根据您选择的图像增强操作，在数据集子图片文件夹下新增对应的增强图像文件和增强后的标注文件。：目标分类图像增强功能对目标分类的图像数据进行增强处理，通过增加数据的多样性，提高模型的泛化能力，使模型能够更好地应对不同场景和条件下的图像分类任务。：在平台主界面中，找到并点击目标分类图像增强功能入口，进入图像增强界面。：在文件夹设置区，点击“设定文件夹”按钮，分别为“数据集图片文件夹”选择路径。：初始化线程，接收图像文件夹和复选框信息。：图像增强完成后的处理，如显示提示信息等。

2025-05-06 11:22:08 377

原创关于目标分类标注界面、功能及代码框架

选择后，文件的全路径将显示在对应的主界面上，标签文件中的内容会显示在标签列表区，列表中的序号会自动生成，并为每个标签生成相应的键盘快捷方式（0 - 9）。准确的标注数据能够帮助模型学习到不同类别图像的特征，从而提高分类的准确性，本系统的优点在于通过方向键+快捷键实现快速分类。缩略图区会显示源图片文件夹中的图片缩略图，一行显示 3张，默认选中第一张图片，图片操作区会展示该图片的原图。：按下 0 - 9 键盘上的数字键，可将当前选中的图片移动到对应标签值的子目录下，完成图片的标注。

2025-04-30 00:00:34 495

原创关于目标检测半自动标注界面、功能及代码框架

目标检测半自动标注功能结合了模型预测和人工标注的优势。系统首先使用训练好的模型对图像进行初步预测，生成预测标注框和标签，用户可以在此基础上进行修改和完善，从而提高标注效率和准确性。目标检测半自动标注的界面更像标注界面而不是预测界面。

2025-04-29 11:54:08 904

原创关于目标检测预测界面、功能及代码框架

目标检测预测功能使用训练好的目标检测模型对图片或视频进行分析，识别其中的目标物体，并将检测结果以可视化的方式展示出来。用户可以通过该功能评估模型的性能，验证模型在实际应用中的效果。

2025-04-29 11:52:35 845

原创关于图像分类和检测一体化平台目录结构说明

生活用品：backpack、umbrella、handbag、tie、suitcase、frisbee、skis、snowboard、sports ball、kite、baseball bat、baseball glove、skateboard、surfboard、tennis racket。动物：bird、cat、dog、horse、sheep、cow、elephant、bear、zebra、giraffe。电子设备：tv、laptop、mouse、remote、keyboard、cell phone。

2025-04-29 00:00:19 503

原创关于目标检测训练界面、功能及代码框架

训练结束后，系统会根据控制台输出和 YOLO 训练产生的变量，计算各训练指标，并将这些指标显示在控制台区的训练图表中。：“模型名称（model）” 默认值为空，点击“选择模型文件”按钮，在弹出的文件选择对话框中选择预训练模型（.pt 文件），选择后文件路径将显示在相应的输入框中。：在控制台区的窗口的最后两行中找到Results saved to 的目录，在资源管理器打开，并找到其子目录weights，将best.pt拷贝到models目录下，并将文件名改名为数据集的名称，为将来预测做准备。

2025-04-25 07:15:43 1125

原创关于目标检测数据集划分界面、功能及代码框架

最后，系统会在目标数据集图片文件夹和目标 Text 标注文件夹中建立训练集、验证集和测试集的子目录，并将划分好的图片和标注文件移动到对应的子目录中。训练集用于模型的训练，验证集用于在训练过程中评估模型的性能，调整模型参数，测试集用于最终评估模型的泛化能力。：在设定目标文件区，点击“设定文件夹”按钮，分别为“目标数据集图片文件夹”和“目标 Text 标注文件夹”选择路径（yolo训练默认，images和labels在同一个文件夹下）。：在数据集划分区，有训练集、验证集和测试集的 CheckBox 选项。

2025-04-24 07:15:46 871

原创关于目标检测图像增强界面、功能及代码框架

点击“数据增强”按钮后，系统会根据您选择的图像增强操作和对应的执行动作要求，在数据集图片文件夹和 Text 标注文件夹目录下新增对应的增强图像文件和增强后的标注文件。这是一个基于 PyQt5 的图形用户界面类，用于创建目标检测图像增强的操作界面，允许用户选择图像和标注文件夹，选择不同的图像增强方法并执行增强操作。遍历所选图片文件夹中的图片文件，根据用户勾选的增强功能复选框，对图片和对应的标注信息进行相应的增强处理，并保存增强后的结果。：对图像进行随机块遮挡增强，随机遮挡图像的某些区域，增加数据的复杂性。

2025-04-23 07:15:45 1125

原创关于目标检测标注格式转换界面、功能及代码框架

设置好三个文件夹路径后，点击“Json 转 Yolo 格式”按钮，系统会将 Json 标注文件夹中的所有 Json 标注文件转换为 Yolo 和 labelimg 格式的 TXT 标注文件，并将转换后的 TXT 文件保存到 Text 标注文件夹中。：在平台主界面中，找到并点击目标检测标注格式转换功能入口，进入格式转换界面。：设置好三个文件夹路径后，点击“XML 转 Yolo 格式”按钮，系统会将 XML 标注文件夹中的 XML 标注文件转换为 TXT 标注文件，并保存到 Text 标注文件夹中。

2025-04-22 00:02:52 501

原创关于目标检测标注界面、功能及代码框架

选择后，图片文件夹的全路径将显示在对应的主界面上，图片预览区将显示该文件夹中第一张图片的缩略图，图像标注区将自动加载并展示该图片，图片会自适应图像标注区的大小，不会出现变形。：为了以更好的视角进行图像标注，可点击操作设置区的“放大”或“缩小”按钮，图像标注区的图片会相应地进行放大或缩小操作，标注框也会同步进行缩放，并且标注的位置会根据缩放比例进行准确还原。选择后，图片文件的全路径将显示在对应的主界面上，图片预览区显示该图片的缩略图，图像标注区展示完整图片。：将当前图像的标注信息保存为 XML 格式的文件。

2025-04-21 00:00:32 893

原创图像分类和检测一体化平台功能介绍

这个系统利用周末或晚上时间陆陆续续做了将近两个月，基本上实现了从数据标注、标注格式转换、数据集划分、数据增强、训练、预测、半自动标注的完整流程，涵盖了图像分类和图像检测，功能超越了市面上绝大多数工具，界面不一定很美观，代码不一定很优雅，所以在开源方面比较犹豫，先把每个部分陆陆续续放出来吧，界面和代码框架，看看反应如何。：包括目标检测标注、训练、标注格式转换、图像增强、数据集划分、预测以及半自动标注等功能，满足从数据准备到模型应用的全流程需求。

2025-04-18 11:59:49 695

原创天雷滚滚我好怕怕，大家都来手搓哪吒

为了这部电影，他耗时数年，从剧本的反复雕琢，到人物形象的精心设计，再到每一帧画面的细腻打磨，无不彰显着他对动画的热爱与执着。这一成绩的取得，绝非偶然。如果你也是一个热爱哪吒的人，不妨也拿起手中的画笔，或者用其他方式，创作出属于自己的哪吒。虽然我的画技可能比不上专业的画师，但我相信，我对哪吒的热爱都融入到了每一笔、每一划之中。我希望通过我的画，能让更多的人感受到哪吒的魅力，感受到中国传统文化的博大精深。从哪吒那标志性的黑眼圈，到他充满力量感的身形，再到他手中的混天绫和火尖枪，每一个细节我都反复琢磨。

2025-03-19 00:57:30 510

国际统计年鉴2024年是一部综合性的国际经济社会统计资料年刊

SQLSERVER2008存储结构一_系统视图.doc

SQLSERVER2008存储结构三_堆数据表.doc

SQLSERVER2008存储结构二_GAM、SGAM、PFS、IAM、DCM、BCM.doc

python内置函数.pdf

空空如也