自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 资源 (1)
  • 收藏
  • 关注

原创 将生成的pandas DataFrame数据写入excel的指定位置

DataFrame格式数据想要写入excel的指定位置,比如第三行的第二列,网上的方法基本是使用to_excel直接写入,这样写入的位置就是固定的,不能指定位置。通过openpyxl灵活设置的方式写入数据,这种方式对传统的中国式报表设置很友好。

2023-02-20 17:03:28 6883 1

原创 Python 操作Excel自动化报表格式设置

【代码】Python 操作Excel自动化报表格式设置。

2022-12-16 01:00:00 506 1

原创 python 一维列表转多维列表

数据需要是双层列表的结构,使用的是to_numpy().tolist()方法对数据进行转化,数据中首先使用透视表对数据进行了透视处理,然后通过该方法转换,发现转换之后没有没有表头,于是乎只有自己拼接表头,表头是一个一维的列表,数据是双层列表,类似这种。现在需要将表头转化成。

2022-12-14 00:45:00 694

原创 使用Python自动生成带有图表文字的PDF(附带万字完整代码)

目录1、前言2、数据取数与Reportlab包说明3 、导入PDF生成相关包4、初始化函数封装5、PDF页脚6、PDF页眉7、PDF封面8、PDF正文内容:表格9、PDF正文内容:图表以及展示布局10、生成PDF生成文件样本案例,本次模板生成偏向于PPT页面比例,如果要用使用A4纸张大小的页面可以自行进行设置,设置的参数会在后续代码中介绍,参考文档可以查看文件:https://download.csdn.net/download/sinat_39027078/87260262生成的文件示例如下图截图所示,生

2022-12-13 11:58:16 681

原创 统计学中基础概念之为什么需要统计学

目录1、研究背景与原始数据2、提出假设2.1 数据收集工具2.2 研究者预期3、假设检验3.1 描述统计3.1.1 集中趋势度量3.1.2 离散性的度量3.2 推断统计统计学实际上是一个工具,用于检验想法。研究的问题:害羞以及其他个性特征与暴力行为是否可能存在一定的联系;原始数据:实际分数或其他测量数据。本次案例数据来自于突然杀人犯研究的19名狱犯的数据,其中突然杀人犯组有10名狱犯,杀人惯犯组有9名狱犯。女性化——男性化 BSRI自我过度控制 MMPI一般数据分析之前会提出假设

2022-12-06 18:01:17 417

原创 【pandas】文本处理:如何将相同ID的字符串进行合并以及合并之后重命名

原始数据中ID对应多个文本数据,现在需要将ID下面的文本进行合并。在工作中曾经遇到过这样的场景,有一批客户,客户用客户ID表示,每个客户下面有很多条评论,需要将客户的评论进行合并,然后对客户的评论进行文本挖掘。思路和下面的思路一样。

2022-11-17 18:03:34 1014

原创 gensim 安装出错解决

网上找了很久这个问题的解决办法,都不没有解决,我的这个问题大概是是因为我的python 环境有多个,多个python有不同的安装路径,导致在安装的时候找不到路径。我的解决办法,下载gensim对应的版本(对应版本的查看可以在命令行中输出python 可查看python 对应的版本)把gensim 中.whl文件下载到python.exe所在的文件夹下,然后在命令行输入。出现这个问题一般是环境不匹配导致的。

2022-11-14 11:06:28 3707 2

原创 我的创作纪念日一周年

第一次使用CSDN是刚毕业参见工作的那一年,注册了但是一直没有正经的使用,第一次发布文章到CSDN是那会刚刚学习机器学习,就把学习笔记发布到CSDN了,时间一转眼就是一年了,这一年因为慢慢学着把学习的过程以及一些技术要点整理输出成文章,而有了很大的收获。因为在平台上输出,也经常浏览大佬的文章,收获真的太大,发现CSDN真的是一个很好的学习场所,用好它可以解决很多工作中的问题。未来核心技术的掌握一定是发展的关键,好好加油学习,夯实基础,做好技术在场景的应用吧,加油。1、随着不断的输出整理对知识点有了。

2022-11-09 15:06:32 138 4

原创 python nltk 安装失败以及download()出错

python nltk 安装失败以及download()出错 问题解决

2022-11-08 09:29:59 4016 1

原创 ValueError: Dimensions of labels and X must be compatible

ValueError: Dimensions of labels and X must be compatible

2022-10-24 17:12:34 6904

原创 聚类算法理论

聚类是一种无监督学习算法,聚类的过程是一个见李假设的过程,使用聚类之后还需要总结每一类别的基本热证,从而更加清晰了解问题的实质。

2022-10-19 09:28:41 1236

原创 /Applications/anaconda3/bin/python.app: line 3: 17787 Segmentation fault: 11 /Applications/anaconda

首先检查pycharm中系统环境配置首先将环境调整成python3的环境,或者anaconda 中的环境。这种错误是因为matplotlib 版本问题,直接把原来的卸载,然后在安装最新的版本我的问题就解决了。我的程序是因为在使用matplotlib 时候出的错误。pycharm 中系统环境配置。或者在pycharm中卸载。我的程序还会报下面的错。

2022-10-13 23:59:01 588

原创 Python map()使用详解

将传入的function作用到iterable中的每一个元素中,并将结果组成新的列表(python2)/迭代器(python3)返回。在python3中要返回列表需要在进行一步操作

2022-10-10 06:00:00 216

原创 Python Strip()使用详解

strip()函数功能:默认删除字符前后的空格,如果有指定字符删除自定字符前后指定字符。注意,该函数只能删除字符前后的字符,不能删除字符中间的字符。

2022-10-09 10:03:56 968

原创 Python Pandas索引,iloc和loc使用

Python Pandas索引,使用pandas筛选定位取数

2022-10-03 06:00:00 165

原创 Python Pandas.Dataframe缺失值处理方法

pandas 缺失值判断以及常用的缺失值处理的方法。常用的处理方法有删除缺失值、将缺失值填充成0,以及使用向上填充和向下填充的方法。

2022-10-01 07:00:00 3924

原创 Python Matplotlib 子图

使用python绘制多个子图的场景,子图的布局,数据显示,以及图形组合问题解决。

2022-09-28 04:00:00 3014

原创 python 数据可视化之图表选择

常用的场景中图表的选择,以及常用图表代码展示

2022-09-27 20:14:59 432

原创 Python pyecharts 数据可视化

pyecharts:python 调用echarts库,echarts 是开源的可视化工具,有丰富的图表展示功能。

2022-09-22 20:00:00 5297 2

原创 python 相关分析

关联分析用于考察变量间数量关联密切程度的统计分析方法,比如身高越高,体重一般会越大。几乎所有涉及到多个变量的假设检验方法,都可以被看做是这些变量间的关联性分析。

2022-09-20 16:49:36 7814

原创 Python 操作excel之字典应用

python 字典的基本操作,包括字典的特征以及一些典型的应用;常见的结合zip函数应用;在实际工作中的应用场景

2022-09-16 16:00:00 1080

原创 Python中if与while的区别以及break与continue的应用

Python中if与while的区别以及break与continue的应用;以及python 操作excel的实际应用案例,可以更好的理解break的应用以及精进python操作exce的应用

2022-09-15 11:26:12 3247

原创 Python Datetime模块

Python Datetime模块 工作中一些实用语句

2022-09-09 16:23:56 136

原创 python 假设检验

使用python进行假设检验,涉及假设检验中的原理,常见的统计量以及具体的使用案例

2022-08-24 11:09:49 3352

原创 Python 自动化报表格式设置

报表自动化中excel的格式处理时其中很总要的一部分,以下内容为常见的python操作excel的格式处理。【设置单元格的背景色】

2022-07-21 17:09:53 231

原创 Spring的定时任务@Scheduled

Spring的定时任务@Scheduled 年、季度、月、周

2022-06-23 11:16:49 129

原创 python 因子分析

因子分析,主要用于对数据剔除相关性降维处理,本文为使用python对数据进行因子分析的全过程

2022-06-06 14:43:48 5628 6

原创 TypeError: detail_staff_visit() missing 1 required positional argument: ‘self‘

python 在调用类的时候报错detail_staff_visit = TeamAumWeek.detail_staff_visit() #报错TypeError: detail_staff_visit() missing 1 required positional argument: 'self'因为TeamAumWeek是类,TeamAumWeek()是类的对象调整为detail_staff_visit = TeamAumWeek().detail_staff_visit()相

2022-05-30 16:11:05 71

原创 reportlab中如何完成pdf的分页

1.背景发现在向PDF中添加内容的时候,分页只能在每页的内容填满之后才能分页,最开始是在每页的内容中填写很多的分行符<br/>2.使用可以直接在添加的内容后面,想要分页的地方添加PageBreakdoc = SimpleDocTemplate('test.pdf'), topMargin=40,bottomMargin=20)elements = [] #创建一个空列表用于存放table = [[1,2,3,4],[5,6,7,8]]elements.append(.

2022-05-27 18:22:10 986

原创 python to_numpy()方法 AttributeError: ‘tuple‘ object has no attribute ‘to_numpy‘

最近在使用reportlib库生成PDF,表格部分使用该函数对数据进行转换,转换成指定格式以生成PDF中的表格。对数据产生以下错误:AttributeError: 'tuple' object has no attribute 'to_numpy'to_numpy()方法将数据转换为一个Numpy 数组该方法中有三个参数:1、dtype:传递的数据类型,这个类型一般使用的是 DataFrame、Series 格式2、copy:是否保存数据副本3、na_value:可选用于缺失值

2022-04-11 10:11:31 11895

原创 自动化——Python 操作Excel(二)

办公自动化提升日常办公效率,干掉无效搬砖

2022-02-24 19:58:48 650

原创 办公自动化——Python操作Excel案例

常见的python 操作Excel 的案例,学习案例有立竿见影的效果

2022-02-20 10:47:42 5680

原创 办公自动化——python操作excel

办公自动化工作中更多时候数据源还是excel表格,怎样快速处理这些表格,以便后续分析数据,将是一项基本的技能

2022-01-25 09:34:43 1583

原创 机器学习分类问题(信用卡案例)

sk-learn 中StratifiedShuffleSplit() 函数功能:提供分层抽样功能幕确保每一个标签对应的样本的比例参数说明n_splits:将训练数据分为train/test对的组数,默认为10 test_size/train_size:用来设置train/test对中train和test所占的比例,如设置train_size =0.8 test_size =0.2 random_state:随机种子,便于每次抽样的数据一样,便于调试 shuffle:是否随机打乱n

2021-11-09 16:56:43 1859

Python自动生成PDF工具Reportlab

本文档是 ReportLab PDF 库的简介。 这是一个软件库,可让您直接使用Python编程语言创建Adobe的可移植文档格式(Portable DocumentFormat)(PDF)文档。它同样支持创建图表和数据图形各种位图和矢量格式。 ReportLab库根据您的图形命令直接创建PDF。 没有干预步骤。 预期ReportLab库至少在以下情况下有用: • 网络上动态生成PDF. • 大批量公司报告和数据库发布. • 用于其他应用程序的可嵌入打印引擎,包括“报告语言”,以便用户可以自定义自己的报告。 这尤其适用于跨平台应用程序,这些应用程序不能依赖每个操作系统上一致的打印或预览API。 • 具有图表,表格的复杂文档的“构建系统” 和文字,例如管理帐户,统计报告和科学论文 • 从XML到PDF的一步

2022-12-09

RGB颜色速查大全表格

经常在网上查颜色的RGB值,有时候找很久也没有想要的颜色,现在终于有一份完整的颜色表了; 适合在经常需要在画图颜色配置的人群; 使用该表格可以快速的找到想要的RGB颜色配置,在也不同到处去寻找了。

2022-09-27

博文python 因子分析中使用的数据

博文python 因子分析中使用的数据

2022-06-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除