自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Seon_Pan的记录库

把太阳踩在脚下,却不觉得身处炼狱

  • 博客(35)
  • 资源 (1)
  • 收藏
  • 关注

原创 Navicat图表:数据监测看板,够简单

利用 Navicat 自带的图表功能制作数据看板,简单快捷

2023-03-19 18:52:56 5225 4

原创 统计学笔记:赤裸裸的数据任人打扮

拖拖拉拉两个月,终于看完了今年第一本书——《赤裸裸的统计学》,本书作者采用故事性叙述,梳理了统计学中基础而关键的知识点,作为统计学的科普读物,表述更容易让外行人接受。笔者根据自身理解对其中部分内容进行了小结,并结合《数据产品经理必修课:从零经验到令人惊艳》一书的统计学部分内容进行补充,整体以前者为主,感兴趣的同学推荐阅读两本原书。

2023-03-13 23:36:42 725

原创 关联规则之 Apriori 算法实现

Apriori 算法是电商数据挖掘中的经典算法,用于发现商品之间的关联规则,例如买了 A 和 B 的情况下是否还会买 C,通过计算商品组合之间的支持度和置信度来实现

2022-11-24 21:06:06 1818

原创 SQL练习:表妹不在,没人帮我查表,只好自己来了

对 `tp` 重新归类,原本是 a、aa、b、c、d、dd 六类,先变成 A、b、c、D 四类,并分不同时间段计数,且按指定的新分类顺序 bADc 排序

2022-08-08 21:20:01 1028

原创 基于yake的中文关键词提取试验

主要采用了词位置、全文词频、上下文关系、句间词频等 4 个指标,提取中文文本的关键词

2022-05-23 21:53:26 2873 5

原创 从各大APP年度报告看用户画像——标签,比你更懂你自己

在忙碌的日常里,人们抽不出时间了解自己,却能抓紧所有的空闲,用手机里的APP去了解世界,在探求的过程中,也被探求着。

2022-03-27 22:21:28 2513

原创 我爬取了CSDN总榜TOP10博主的2万多篇文章,看看他们为什么这么火

笔者将 CSDN 总榜 TOP10 的大佬们的文章数据爬了下来,分析一波大佬们名利前茅的秘密所在。

2021-11-04 21:32:33 2742 20

原创 还在用收费的工具处理PDF?用Python助力冲破会员牢笼

基于 PyPDF2 与 pdfplumber 操作 PDF 文件,可对页面增删改、提取文本/表格/图片、将页面导出为图片等

2021-10-13 18:24:50 745 1

原创 分析对象竞是我自己?我在 9 月上班划水 1510 分钟!

国庆 7 天假完全没有学习!在内卷时代如此躺平,实在令人胆战心惊啊,时间都去哪儿了呢?用 pandas 和 pyecharts 分析一波吧

2021-10-11 22:05:49 1509 2

原创 Github 提交笔记

记一次 github 提交过程,以往每次提交都现查资料,有必要记录一波!

2021-09-09 10:24:28 148 2

原创 全网首发,你没玩过的pygame小游戏开发:马赛逻辑

基于 Pygame 开发的逻辑类小游戏,类似数独

2021-09-06 19:29:01 1612 4

原创 用python开发一个炸金花小游戏,注意别玩上瘾了

用 Python 来实现一个类似炸金花的扑克牌小游戏,游戏使用一副除去大小王的扑克牌,共 4 个花色 52 张牌,各个玩家从中抽取 3 张牌,比较大小。各种牌型的大小顺序:同花顺 > 豹子 > 顺子 > 金花 > 对子 > 单张

2021-08-23 19:02:23 6460 6

原创 Python分析一下双色球,中大奖指日可待

双色球数据分析,仅供技术讨论!

2021-08-15 23:58:01 1107

原创 淘宝爬虫:看看房地产拍卖行情怎么样?附可视化分析

本文对杭州市法拍房数据进行了从数据采集到分析结果呈现的介绍,讲解了爬虫的知识点:分析网页结构、动态加载的数据、jsonp等,并利用多种精美的可视化呈现分析结果

2021-08-02 21:40:59 3856 16

原创 PyQt5自定义图片组件:同时显示多张图片

基于 QLabel 和 QHboxlayout 实现的可定制的图片组件类,可以翻页显示、设置每页图片数和图片显示的尺寸等

2021-06-15 21:36:32 11467 19

原创 一道题笔记:递归、嵌套列表去重与排列组合

给定 4 种面额的钞票和目标金额,找出有多少种钞票组合,满足总金额等于目标金额。例如 [1, 2, 5, 10] 这4种面额,组合成 10元,那就有 10 张 1 元 / 8 张 1 元 + 1 张 2 元 ... / 1 张 10 元等情况

2021-05-23 12:10:00 238

原创 matplotlib柱状图轴标签自定义排序

昨天一位同学提问 “matplotlib 画柱状图时,横坐标是从表格中指定列获取的,如何设置横坐标的顺序呢?” 原始数据结构如下图所示,需要对学历分组求平均工资后画柱状图,顺序应为按学历由低到高,即 ['大专', '本科', '硕士', '博士']

2021-04-24 14:12:03 6792 2

原创 数据可视化?不如用最经典的工具画最酷炫的图(EXCEL/PPT)

前言:做数据分析和做科普是类似的,科普的意义在于将晦涩难懂的科学知识,以让大众更易接受和理解的方式呈现。而数据分析中的数据可视化做的正是如此关键中的关键,即是将数据的特点以一种显而易见的形式进行呈现。但也不必说的那么高级,我们可以说数据可视化就是“画图”。能够进行可视化的工具有很多,比如 python 中的 matplotlib、pyecharts、plotly等等。可有时候我们并不想写代码,我们可以选择很多便利的在线工具,还可以用最经典的——EXCEL 和 PPT。下面,笔者将请这两位 office 老员

2021-03-26 08:04:53 1918

原创 PyQt5实战:你是成熟的软件啦,该有启动画面和加载进度条了!

笔者在最近的工作中做了一个基于PyQt5实现GUI的数据处理工具,领导表示“我想一双击就能直接看到情况啊,不要打开后还要我自己输入这个点击那个的!”好吧,既然上头有需求,打工人就得照办。想想以前用过的许多桌面软件,启动时都会有个欢迎画面,同时后台预加载一些内容。那么应该要怎么实现呢?先看看效果吧。1、界面设计首先欢迎画面要有一个好看的背景,还有进度条和进度提示信息,那么先用一个 Widget 来做容器,再把用于显示 Logo 和进度信息的 label 拖出来,最后摆上进度条 progressBa.

2021-01-31 22:27:56 6694 5

原创 实战笔记:利用pandas提升分词后过滤停用词的效率

前言:最近工作中开发了一个需要对大批量文本进行分词及统计词频的工具,主要是在 jieba 分词、过滤停用词两个环节耗时。分词部分可以考虑采用 jieba-fast 库提升速度,而过滤环节的效率一直没找到好方法,今天偶然发现了pandas可以帮助实现!1、常规方法那么开始吧!首先完成分词部分,得到一个储存了所有单词的超大列表;import pandas as pdimport jiebastopwords = [line.strip() for line in open('chineseSto.

2021-01-06 16:20:24 1456 5

原创 PyCharm实用快捷键十则

在PyCharm中编码时用于提升效率的快捷操作

2020-12-04 23:49:22 528 3

原创 干货不看看嘛:python列表去重的5种方法

用5种方法对列表元素去除重复项

2020-10-29 10:52:17 1195

原创 PyQt5实战之二维码生成器(五):待优化处和应对措施(附打包后的exe)

前言通过前四个章节,实现了一个能够嵌入多种类型数据和定制样式的二维码生成工具,其具有了生成图像、在界面中显示图像、设置图像风格、另存为图像、界面状态提示和国际化等相对完备的功能。但仍存在许多可以改进的地方,其中比较显著的问题如下:1、多行文本的字数未作强制限制,仅通过弹窗提示上限为 200;2、背景图模式下,输入数据实时修改二维码存在明显的卡顿问题;3、myqr 库的数据输入不支持中文。笔者将在这个章节,继续说明针对这三个问题的应对措施。一、多行文本的字数限制首先确定想要实现的效果:用户输

2020-10-24 11:57:42 385

原创 PyQt5实战之二维码生成器(四):界面的国际化与管理打包资源

前言经过上一章,我们实现了二维码的生成及样式修改,并将其显示在界面中。本章将实现界面的国际化,并说明如何管理打包资源。一、界面的国际化在之前的代码中可以发现,有些文本用 self.tr() 括了起来,这些文本就是要被翻译的内容。通过这种方法对待翻译文本做好标记后,进入命令行:pylupdate4 我的程序.py - ts zh_CN.ts如此便将待翻译文本剥离出来,生成了一个 .ts 文件。然后通过 Qt 语言家来打开它, PyQt5 中语言家的执行程序路径如下图所示:打开后可以看到一段

2020-10-13 13:14:48 288

原创 PyQt5实战之二维码生成器(三):定制化二维码

前言经过上一章,我们实现界面中各个控件的功能,本章将说明二维码的生成及样式修改。千呼万唤始出来(虽然并没有呼唤,但总要想个开头),终于到了核心功能的生成二维码部分。万能的Python生态中自然不乏生成二维码的库,笔者采用的是以下两个库,分别用于生成 logo 和背景图模式的二维码。import qrcodefrom MyQR import myqr一、自定义前景色和Logo输入的参数为:数据、尺寸(默认为5,暂未增加用户修改的功能)、图像路径(默认无图像,可以修改前景色)、颜色代码(默认黑

2020-10-08 11:34:48 484

原创 PyQt5实战之二维码生成器(二):控件功能实现

前言经过上一章,我们构建了二维码生成器的基本界面,本章将实现界面中各个控件的功能。文章目录一、工具箱的数据输入二、颜色选项卡三、图像选项卡四、菜单栏五、状态栏一、工具箱的数据输入创建一个 getQR() 方法用于生成二维码,每次生成二维码时需要对传入的参数进行验证。def getQR(self): # 生成二维码 data_flag = self.toolBox.currentIndex() # 数据类型(所选栏目) data = '' if data_flag ==

2020-10-05 20:49:20 909 2

原创 PyQt5实战之二维码生成器(一):基本界面设计

前言本实战项目为构建一个桌面应用,功能是定制二维码,实现多种数据类型的嵌入,和二维码样式的多样化。涉及知识点:基于 PyQt5 的界面构建和功能实现(包括标签、按钮、文本框、滑块、选项卡、工具箱、菜单栏、状态栏等控件),界面国际化(文字英汉互译),基于qrcode和myqr库定制二维码(颜色、logo、背景图),用 qrc 文件管理打包资源。阅读前应具备 Python 基础和对 PyQt5 库的入门知识(可见 PyQt5初学试验记录系列文章)。文章目录一、打包后的工具使用效果预览1、生成普通二维

2020-10-04 22:27:40 1905

原创 Python-docx实战:同事要我帮忙补写178份日报!别吧

基于 pychon-docx 操作 word 文档的综合运用

2020-09-19 22:24:52 967 1

原创 用Python把它做出来:EXCEL文件合并/拆分工具 (含VBA版)

VBA和Python操作EXCEL文件

2020-07-12 14:21:37 1248 1

原创 PyQt5试验:基于QTableWidget的应用

基于 QtableWidget 控件,结合时间管理四象限思想,制作一个简易的任务优先度计算器

2020-07-11 21:32:07 1955 4

原创 程序员的求生欲:用python给女友一个七夕惊喜二维码吧

知识点: Python 动态条形图,定制二维码,快速部署静态 html 页面。

2020-07-09 10:43:26 1539 1

原创 干货不看看嘛:比较xlsxwriter/pandas/openpyxl写入excel文件

使用 xlsxwriter/pandas/openpyxl 三个库来实现数据写入 EXCEL ,以及向已存在文件追加数据

2020-05-23 20:57:51 5346

原创 PyQt5初学试验记录(三):Pyinstaller打包小结

用pyinstaller打包一个基于pyqt5的程序

2020-05-23 20:35:19 904

原创 PyQt5初学试验记录(二):从界面获取参数到爬虫信息反馈回界面

通过各类控件从Qt界面传参给脚本,获取脚本的反馈信息等

2020-05-16 14:33:54 1255 4

原创 PyQt5初学试验记录(一):从安装PyQt5到窗口间跳转

从安装PyQt5库到最终打包成.exe的过程,分为三个部分

2020-05-16 11:59:55 1272

MainFunction.py

https://blog.csdn.net/zohan134/article/details/106156402文章附件,阶段性源码

2020-05-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除