自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

呆萌的代Ma

战力只有5的渣渣,发奋图强中

  • 博客(1510)
  • 资源 (13)
  • 收藏
  • 关注

原创 python loguru记录并解析序列化后的内容

即可将所有使用logger写入的日志转变为json格式,方便进行解析。

2024-02-23 11:05:16 478

原创 openpyxl隐藏/删除excel某一列

注意:openpyxl尽量使用隐藏而非删除,因为删除某一列在存在有合并单元格的操作时,会出现合并单元格的相对位置不会发生变化,从而导致数据发生偏移的问题,而隐藏某一列不会出现这个问题。

2024-02-21 09:11:33 1173

原创 python使用openpyxl添加图片到excel文件中

【代码】python使用openpyxl添加图片到excel文件中。

2024-02-20 11:21:41 1803

原创 python使用apscheduler动态添加定时任务

因此,在系统中,使用需要动态添加的自动化程序时,只需要返回一个。的实例,然后添加任务即可。

2024-02-19 10:16:31 711

原创 dolphinDB创建适合存放股票代码的分布式数据库

这行代码指定基于哈希分区,同时哈希值使用10个长度,这样既可以存放一般的股票代码,也可以存放比如期权这种比较长的代码。

2024-02-11 03:29:26 469

原创 dolphinDB使用select筛选时间字段

日期格式博主使用python的dataframe保存时,是。就是筛选大于2020.01.01的数据了。,因为dolphinDB中日期格式是。列大于2020.02.29的全部数据。

2024-02-11 02:30:24 529

原创 解决Windows程序与Mysql连接报错 [WinError 10048] 通常每个套接字地址(协议/网络地址/端口)只允许使用一次

这是因为mysql与程序之间已经耗尽了动态范围内的端口,链接的开关过于频繁。

2024-02-08 08:42:04 939

原创 pandas dataframe写入excel的多个sheet页面

【代码】pandas dataframe写入excel的多个sheet页面。

2024-02-07 15:03:59 1692

原创 企业飞书应用机器人,使用python发送图文信息到群

企业飞书应用的自动化,需要创建企业应用,应用开通机器人能力,并获取机器人所需的app_id与app_secret。

2024-02-06 09:04:49 1998

原创 企业飞书应用机器人,使用python自动发送文字内容到群消息

【代码】企业飞书应用机器人,使用python自动发送文字内容到群消息。

2024-02-05 15:34:32 1690

原创 pandas剔除带时区的数据

【代码】pandas剔除带时区的数据。

2024-02-04 12:58:03 362

原创 因子分析1——python因子的异常值处理、标准化、市值/行业中性化

市值大的是真的大,小的是真的小,如果我们不对市值做处理,就没有办法对因子做“提纯”,奇怪的数据会得到奇怪的模型。为了解决杂质的影响,我们通过“市值中性化”这种方法,剔除市值的影响。原始数据的分布在使用一些拟合的方法时,异常值(超大、超小)对结果的影响是毁灭性的,因此我们对异常值做处理,但是金融数据大多数都不是错误的数据,而是确实存在但难以处理的数据。基于截面数据的建模并不是说:当前截面的情况对应了未来就会如何如何,而是后验的去描述,未来表现如何如何时,历史上的截面数据大概有什么样子的表现。

2024-02-01 14:20:09 1089

原创 基金评价指标1——收益率、回撤、下行标准差、痛苦指数、夏普比率、索蒂诺比率

【代码】基金评价指标1——收益率、回撤、下行标准差、痛苦指数、夏普比率、索蒂诺比率。

2024-01-30 13:27:17 685

原创 DolphinDB学习(2):增删改查数据表(分布式表的基本操作)

将原来的内存表的数据表迁移到分布式数据表中。,查询数据表里的表有以下两种方法。因此在已有的数据表中追加数据。

2024-01-27 10:44:56 1837 1

原创 python使用read_sql与to_sql读写数据库

使用pandas读写数据库的方法(以Mysql为例)如下:读取数据库读取数据库read_sql()在读取的时候容易报错,有几个要点:1. 首先导入,然后以的形式传入第一个参数2. 在第二个参数需要使用。

2024-01-24 15:42:29 1003

原创 解决python matplotlib绘图报错AttributeError: module ‘backend_interagg‘ has no attribute ‘FigureCanvas‘

【代码】解决python matplotlib绘图报错AttributeError: module 'backend_interagg' has no attribute 'FigureCanvas'

2024-01-21 12:38:41 524

原创 DolphinDB学习(1):数据库的增删查与常用操作

下载并配置好DolphinDB,同时添加vscode的插件,我们就在vscode上进行操作创建xxx.dos文件后,就会被识别为DolphinDB的运行文件,非常方便。

2024-01-20 11:35:21 759

原创 DolphinDB学习(0):DolphinDB基本概述

DolphinDB的学习难度不小,主要是写法比较多,官方示例是一次性给一大堆代码,在没有成体系的学习基础的前提下,总有种力不从心的感觉,所以博主汇总这一个系列的文章,尝试从最简单的基础常规操作开始,一边学习一边记录探索DolphinDB的过程,同时对一些函数做更形象的解释。为了解决这些问题,博主需要选择一个数据库。其实一开始我在摸索的时候,想找一个自动驾驶公司(高可用/稳定,嗯)常用的数据库,然后稳定的使用它,然后对比综合最后选择了一个官方案例中居然有这种案例的数据库DolphinDB。

2024-01-20 10:55:51 623

原创 Windows下载并配置Kettle

注意:需要windows配置Java

2024-01-19 16:15:34 889

原创 使用dataframe_image将dataframe表格转为图片

这个库可以将dataframe的表格转换为图片格式,比起数字,图片的格式在手机上会更清晰的看清楚数据及对应行列。

2024-01-15 09:17:31 1141

原创 分享一个使用python FastApi创建服务的简易模版,与使用http/python请求

这个博客分享一个fastapi的模版,并提供使用http/python访问的示例程序。

2024-01-12 13:26:33 798

原创 解决DolphinDB vscode插件重启后无法访问的问题

【代码】解决DolphinDB vscode插件重启后无法访问的问题。

2024-01-07 17:44:40 624

原创 Windows安装DolphinDB,配置单节点启动与GUI

或是修改文件。

2024-01-06 11:49:54 856

原创 pandas保存style到excel文件中

【代码】pandas保存style到excel文件中。

2024-01-04 15:29:04 852

原创 解决pycharm格式化程序自动删除未使用的import或代码行

使用pycharm的格式化时,不知道点了哪个导致未引用的import被自动删除。

2024-01-03 14:13:39 1150

原创 python合并多个PDF,成为1个PDF

这里我们使用```PyPDF2 ```库进行操作合并的步骤如下:1. 创建```PdfMerger```2. 使用```append()```添加多个pdf文件3. 最后```write()```出即可

2023-12-29 15:36:03 1010

原创 python将Excel的每一个sheet页生成PDF文件

这里我们使用Excel应用导出PDF1. 使用```win32com.client.Dispatch("Excel.Application")```启动Excel2. 使用```excel.Workbooks.Open(excel文件的绝对路径)```打开文件3. 循环每一个sheet,使用```.ExportAsFixedFormat(0, os.path.join(parent, f"pdf_data/{_sheet.Name}"))```将当前的sheet页面生成PDF

2023-12-29 15:26:01 1383

原创 python使用openpyxl为excel模版填充数据,生成多个Sheet页面

【代码】python使用openpyxl为excel模版填充数据,生成多个Sheet页面。

2023-12-29 15:12:59 1125

原创 python使用reportlab在任意PDF中添加文本内容(解决中文黑色方块问题)

【代码】python使用reportlab在任意PDF中添加文本内容(解决中文黑色方块问题)

2023-12-29 14:48:16 1065

原创 解决python使用ReportLab添加中文黑色方块的问题

【代码】解决python使用ReportLab添加中文黑色方块的问题。

2023-12-29 09:28:15 711

原创 matplotlib饼图自定义每一个饼内显示的文本信息

有几个要点:1. 使用plt.pie()绘制饼图,同时需要有一个参数autopct(比如autopct='%.2f%%')这样就可以返回一个auto_texts的返回值2. 循环auto_texts的每个元素,是一个Text类,使用.set_text()就可以重新设置显示的数据了

2023-12-28 13:48:46 524

原创 python使用apscheduler定时任务,固定周几运行程序

在```add_job```中添加参数```day_of_week```即可

2023-12-25 10:28:47 927

原创 Python自适应调整Excel的列宽度

使用python调整列宽度的逻辑需要自己写,这里是参考参考文章中的内容,使用openpyxl打开文件后,将列宽度根据列的内容进行指定,使用来指定列宽。

2023-12-19 17:18:12 2193

原创 Python控制Excel自动刷新页面

这里我们使用python控制Excel的应用来直接刷新相关页面:1. 传入的Excel路径需要是完整的路径2. 使用wb.RefreshAll()进行刷新,老版本的程序是wb.refresh_all(),而博主测试的时候使用的应该是wb.RefreshAll()这个程序3. 刷新结束后等待一些时间,以便给程序更多时间,减少刷新一部分的概率4. 最后使用wb.Save()与xlApp.Quit()保存并退出,如果意外退出程序而没有运行xlApp.Quit(),需要进入控制台并关闭Excel的进程才行

2023-12-19 17:09:39 1029

原创 python使用feather加速读写

网上有测试说针对2G以下的单文件读写的效率非常高,这里做一个使用记录不过需要注意的是:DataFrame写入feather文件时,列(DataFrame.columns)需要是字符串类型。

2023-12-08 14:11:21 977

原创 解决selenium使用.get()报错:unknown error: unsupported protocol

将原来的:```pyurl = "https://www.baidu.com"browser.get(url)```替换为:```pyurl = "https://www.baidu.com"browser.execute_script(f"window.location.replace('{url}');") # 直接平替 .get()```

2023-12-08 08:52:46 703

原创 python pandas读取zipfile压缩包中的某个文件

读取的流程如下:1. zip文件解压缩之后怎么用pandas读取,就在压缩包内也怎么读取2. 使用zipfile.ZipFile()打开压缩包3. 直接用zip_file.open('某个文件.csv')打开这个文件

2023-12-07 09:35:44 922

原创 使用飞书自定义机器人发送消息

【代码】使用飞书自定义机器人发送消息。

2023-12-06 14:33:38 1269

原创 openpyxl带格式复制粘贴单元格内容

openpyxl的复制粘贴流程如下:1. 框定复制的区间:```active_sheet['A1':'B11']```2. 框定粘贴的左上角的单元格:```active_sheet['D1']```3. 然后循环复制范围内的每一个单元格,滑动赋值即可,滑动的时候使用: ```py paste_to_cell.offset(row=0, column=1) # 右移1格

2023-12-06 10:25:43 2086

原创 解决掘金量化平台,赋权原因导致委托异常(委托价格低于标的[xxxx]当日的跌停价格)

在2015-01-05年的时候,前复权价格正确,Wind显示当天收盘价8.49。以长生生物(002680.SH)为例,它已经退市了,下图为Wind的截图。进行回测,最新的版本支持分红配股了, 在交易的时候控制市值即可。但是在下单时,显示价格错误。修改为全部使用不复权数据。

2023-11-29 10:52:07 472

使用pyLDAvis的实例结果,及d3.min.js,ldavis.v1.0.0.css,ldavis.v1.0.0.js

1. d3.min.js,ldavis.v1.0.0.css,ldavis.v1.0.0.js三个文件内容 2. pyLDAvis的实例 3. 实例请参考:https://blog.csdn.net/weixin_35757704/article/details/123150467

2022-02-26

geth_tools.tar.gz

以太坊go-ethereum v1.9.22的官方代码编译后,bin目录下的工具包,可以直接使用

2020-12-27

handless_firefox.tar

包含已调试好的selenium、firefox与python3.6的docker镜像文件,同时有一个测试案例,可以直接运行,使用无界面firefox访问网站

2020-12-26

呆萌的停用词表.txt

停用词表,一共2750个停用词,属于通用停用词表。 下载了很多网上的通用停用词表,同时合并了我们实验室的停用词表后使用下面的代码对停用词表整理。

2019-06-14

主流售房网站爬虫

通过jsoup对主流售房网站的房屋信息进行爬取与提取,然后通过poi将数据保存在本地的excel数据表中。

2017-12-13

一键安装libpcap及其所有依赖文件的脚本

这是一个快速安装libpcap的shell脚本 运行 sudo add_libpcap.sh 在运行中会在桌面上暂时的新建一个libpcap_dir的文件夹,用来暂时存放所有的文件,在安装完成后会删除这个文件夹。 安装文件的版本: m4-1.4.9 bison-3.0 flex-2.6.0 libpcap-1.8.1

2017-11-26

网页爬取爬虫

使用java语言快捷的爬取整个网页的源代码,并且将爬取成功的网页代码与出现错误的网址的错误信息保存到本地文件中.

2017-10-10

Linux离线中文命令手册

linux命令手册,能够快速的查看命令与用法

2017-07-20

软件开发常用词汇

软件开发的常用英文单词及对应中文翻译

2017-07-20

Git 64位 最新版 Git-2.13.1.2-64-bit

Git 64位 最新版 Git-2.13.1.2-64-bit,从官网直接下载

2017-06-20

Python2.x链接Mysql的安装文件

Python2.x直接链接mysql的安装文件

2017-04-23

Python3链接Mysql的64bit安装文件

Python3链接mysql的文件

2017-04-23

W3Cschool参考手册资料

2017-04-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除