![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自学编程
文章平均质量分 63
thinostrich2
这个作者很懒,什么都没留下…
展开
-
数字化转型中PDF文件处理
在数字化转型工作中,需要提取PDF文件中的一些信息。这些PDF文件通常是其他乙方公司用各类CAD文件绘制的,转成PDF后提供给电厂。这些PDF不是扫描件,因此具备从其中提取数据的可能性。纯文本的读取相对容易,稍微麻烦点的是组态图、接线图。原创 2023-04-08 11:55:02 · 170 阅读 · 0 评论 -
使用DTW算法对上证50成分股走势进行聚类分析
0.背景客户要求对发电机组的过程参数进行分析,把走势异常的工艺过程数据挑出来。研究这个需求的时候感觉可能DTW算法比较合适。关于DTW算法的描述前人描述很多。知乎中这位大神的收藏夹有很多关于时间序列算法的描述。时间序列相似度以及聚类 - 收藏夹 - 知乎想着搞点数据来试试才知道效果怎么样以及学会怎么用。然而甲方的数据倒腾起来太费劲。最好搞的数据是从富途上扒拉股票数据。于是决定把上证50成分股的走势搞个聚类看看,哪些成分股的走势是趋同的。1. 准备工作安装DTAIDistance的.原创 2021-09-12 16:47:35 · 1793 阅读 · 0 评论 -
android串口通信
开始学android,在串口上卡了十几个小时后靠GitHub解放了我。首先是这个库:https://github.com/mik3y/usb-serial-for-android按照大佬的指示,第一步添加库引用:Add jitpack.io repository to your root build.gradle:allprojects { repositories { ... maven { url 'https://jitpack.io' }原创 2021-09-05 18:27:44 · 572 阅读 · 0 评论 -
Python从excel到word、PDF和Outlook的自动化
老婆大人最近提出一个需求,从事人资的她每个季度都要跟近期合同到期的人续签合同。续签合同需要提前准备好带有每个人信息的确认函发邮件给其领导签字确认要续约,然后邮件咨询对应员工其信息有无变化和意愿,最后生成相应的续约合同。希望这个过程能够自动化,输入就只是一份近期合同到期人员的excel。这个当然不难,以前老婆有用过OFFICE自带的邮件合并功能。但是只能自动生成一个含有一大帮确认函和续约合同的大WORD,不能自动生成PDF,也不能自动发规定格式的邮件。对于Python来说,这个不算复杂,把一些现成的库原创 2021-07-03 22:22:29 · 472 阅读 · 0 评论 -
使用Python分析股价波动周期
基本思路是获取股价收盘信息后,使用希尔伯特黄变换将股价波动数据拆解为不同周期的波动曲线。再本别利用频谱分析计算每一个曲线的频率。目标是将股价波动数据拆解为不同周期波动的叠加态。1.获取收盘价富途有很好的API接口,给我这种小散送了每个月的使用次数也够了。富途openAPI官网2.希尔伯特黄变换利用pyhht包,官方的文档磕磕绊绊看懂。合起来import pyhhtfrom pyhht.visualization import plot_imfsimport numpy.原创 2021-04-07 13:12:53 · 2054 阅读 · 2 评论 -
Python自动生成巡检报告
需求:利用Python自动生成巡检报告,在客户提交的巡检报告模板里把要填的内容按照{ID1}等标上号。然后利用Python-docx包寻找ID改为需要的值from docx import Documentimport timeif __name__ == '__main__': st=time.process_time() document = Document('test.docx') for x in document.paragraphs: x.te原创 2021-04-06 22:07:54 · 1348 阅读 · 0 评论 -
PDF文档翻译助手
工作中有大量的英文文档要翻译,都是PDF格式的。试了下网易等公司的PDF翻译功能,出来的东西实在没法用。简单测试一下发现,翻译效果差的原因是这堆PDF文档每一行后面都跟了一个换行符。去掉这些换行符,翻译软件们就认识这几行是一句话,翻译出来就像样了。因此要做的事情很简单,C#写个小APP,把黏贴进来的PDF文本用正则表达式把不是句号后面的换行符都替换成空格。因为句号后面的换行符一般是另起一个自然段。核心代码就下面三行。 string needTrans = inputTex原创 2020-08-03 21:41:47 · 145 阅读 · 0 评论 -
基于自然语义分析的大纲近似度分析
工作中遇到这样一种困惑,需要从几个基地的硕大无比的excel文件中比对对某个设备的维修大纲是否一致。比如有的基地要求“在50%FP平台下修改Gk参数”,而有的基地同一件事情的描述是“修改Gk参数(50%FP)”。用vlookup不太能解决这种问题。如果完全手工操作,就只能先用基地1的描述作为基础,从中提取关键词,在基地2/3/4/5的excel里面搜索,找到了就复制过来(包括周期、负责单位等一些列信息);然后换基地2作为基础,重复上述操作。显然,最麻烦的就是提取关键词去找和复制粘贴工作,如果exce原创 2020-08-03 21:30:41 · 101 阅读 · 0 评论 -
自学笔记2-爬虫分析中国人民银行货币政策报告2
由于肺炎假期在家太无聊,开始学习模式。今天终于实现了把央行货币政策执行报告全部爬下来。高兴之余写篇博客记录下。需要安装的项目有selenium和pyautogui。代码分3个步骤:1. 配置selenium chrome2. 在央行第一个页面把所有执行报告的链接拿下来3. 进到一个个页面把PDF文件下下来1. 配置selenium chrome一般教程上说的P...原创 2020-01-30 14:29:49 · 1503 阅读 · 1 评论 -
自学笔记1--爬虫分析中国人民银行货币政策报告1
看Python爬虫这么火,自学一下,搞个小项目练练手。目标爬下每个季度的中国人民银行货币政策执行报告,分析其中看上去最重要的“中国宏观经济形势”和“下一阶段主要政策思路”,分析其每个自然段的第一句话的变化情况。结合利率市场和M2投放量数据看看相互间的关系,写一篇知乎文章出来。这个项目以为比较简单的,但是实施起来发现难度很大。。。主要还是我太水。。。主体需要做的内容,首先从 央行官网把政...原创 2020-01-30 14:04:50 · 1558 阅读 · 0 评论 -
生活发生了很大的变化
很囧的是在4月之后才过了2个月,就成功完成了跳槽,并没有如以前想的那样用上python或大数据。。。。anyway,回到深圳。购物手痒买了树莓派,以后这个博客就记录下树莓派的玩耍过程吧。。。淘宝上买来的板子,店家已经做好了系统,直接按教程弄到SD卡上就好。然后有一些简单的注意事项记录一下:1. 默认的python是2.7的,向新技术靠拢,自己换成python3了。(看这里)2. 想...原创 2019-06-21 13:50:02 · 197 阅读 · 0 评论 -
写在一开始
没想到毕业9年后要把这个账号找回来了。大学时在华工百步梯和电子设计比赛中度过了愉快的时光,但是毕业时贪图享受来到一个山沟沟里盖电厂。电厂盖好了,但依然无法融入这个山沟沟。为了能回深圳跟女友和家人团聚,努力拼搏,集团深圳分公司想要我,但这里却不放。没有办法,动起了重新拾起编程,回深圳找工作的念头。虽然平时工作中接触的是PLC和DCS,但是真正让自己有机会写PLC/DCS组态的机会太少,公司也...原创 2019-04-15 00:24:05 · 105 阅读 · 0 评论