自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 资源 (2)
  • 收藏
  • 关注

原创 利用python快速删除指定目录下的文件和文件夹

方法一:构造函数,检查指定目录是否为空,如果不为空,使用OS和迭代删除的方法,删除test目录下的所有目录和文件,代码如下:import osimport shutildef del_file(path): if not os.listdir(path): print('目录为空!') else: for i in os.listdir(path): path_file = os.path

2020-10-13 12:21:12 3522

原创 使用python制作九九乘法表的四种方法

1.利用for循环for i in range(1,10):for m in range(1,i+1):print(m,'*',i,'=',m*i,end=' ')print('\r')2.改进的for循环:for x in range(1,10): for y in range(1,x+1): print(f'{x}*{y}={x*y}',end='\t') print('\r')3.利用join和占位符:...

2020-09-19 09:20:15 20762

原创 Python从列表中如何取不同特征的数

有时,我们需要从一个数字列表中取一些具有特定特征的数。比如:最大数、最小数、出现次数最多的数、中位数等等。这时,我们就需要用到一些特定的函数来实现我们的目的了。

2023-06-08 21:49:57 185

原创 Python展开嵌套列表的五种方法

首先,这是一个嵌套列表,如果外面有双引号则是字符串,可以通过eval()来去除,再用列表推导式、for循环、星号解包、列表相加法、集合求并集法等五种方法来展开嵌套列表。。

2023-06-08 08:13:23 155

原创 Python二级综合应用题:《论语》

附件中有 2 个 Python 源文件和 3 个文本文件,分别对应两个问题,请参考编程模板的py文件,修改其中代码,实现以下功能: 《论语》是儒家学派的经典著作之一,主要记录了孔子及其弟子言行。这里给出了一个网络版本的《论语》,文件名称为“论语.txt”,其内容采用逐句“原文”与逐句“注释”相结合的形式组织,通过【原文】标记《论语》原文内容,通过【注释】标记《论语》注释内容,具体文件格式框架请参考“论语.txt”文件。

2023-06-06 20:24:08 150

原创 Python如何批量合并70个doc和docx文件

有一位朋友发来70多个数名命名的doc和docx文件,问我有没有vba代码,可以把这些文件按照数字大小的顺序合并。我试着用了chatgpt,搞了一串vba代码行不通,于时我就找出了Python,尝试了一下还不错。以上代码优点在于可以保证合并后文件的段落、字体等格式信息不变,而且转换的效率还挺高。大家可以测试一下,有问题随时反馈。在实现转换前,需要进行文件遍历、格式转化,最终合并到新的文件中。合并doc,docx文件。

2023-06-06 09:03:17 294

原创 VBA中如何调用自定义函数

在VBA中我要把B列中所有的非空单元格的值都判断一遍,如果大于60就在其旁边的单元格写入"及格",反之就写入不及格。由于B列的非空单元格数量无法确定,所以我们就要定义一个自定义的函数来获取B列中最后一个非空单元格的值,然后再进行遍历循环。在VBA中,End(xlUp)是一个用于定位单元格的方法,它可以用于查找某一列或行最后一个非空单元格的位置。

2023-06-05 09:37:39 371

原创 VBA中的循环代码大全

最近,我在自学VBA,有了之前的Python基础,感觉学起VBA也比较轻松。毕竟VBA和Python一样都是面向对象的编程语言。通过自学,我基本上掌握了VBA的循环方法,以下是我的简单笔记和大家一起分享。

2023-06-04 18:36:31 462

原创 用pandasai轻松上手Python数据分析

据官方介绍,pandasai是一个 Python 第三方库,将人工智能的生成能力集成到pandas包中,使数据分析具有对话性。实际上,该第三方包通过调用openai的API,并根据交互指令来对数据框中的数据进行统计分析,可以筛选、计算、分析出用户想要的数据,甚至还可以绘制图表,功能可谓十分强大。有了这个工具,在不熟悉Python命令的情况下,也通过发送详细的数据分析需求,借助pandasai和openai的API生成所需要的数据或者图表,减化了数据分析的流程,降低了利用Python进行计算、制图的门槛。

2023-06-03 18:19:59 478 1

原创 用VBA打印出某列单元格的值

VBA是比较简单的编程语言,只要安装用microsoft office就可以用来调试代码,不用安装第三方工具,值得大家抽空学一学。如果有Python编程的基础,学起来就非常的简单了。今天我们来学习一下如何用VBA打印出某列单元格的值。比如:我们在Excel中有A列10行从1..10的数值,现在我们想用debug.print打印出这些值,应该如何操作呢?

2023-05-27 21:10:05 939

原创 Python二级编程:分词去重

然后将分词结果中字符数大于等于 3 的词语,按照字符顺序排序,写入到文件 out1.txt 文件中。参考编程模板,完善代码,实现以下功能。算法:可以用open()来打开文件,jieba进行分词,获得句柄后用write写入,由于是按行写入,注意添加换行符。答案:特点是紧扣大纲,中规中矩,代码易于理解,不好的是代码过多,有时可能会漏掉关闭文件。

2023-05-27 16:01:04 731

原创 Python二级编程题:求两点间的距离

个人版中,需要用到math中的sqrt,可以直接开方,同时利用了python的列数特点,不用切片就可以直接给四个数值变量进行赋值,然后再用map函数批量转字符型数型为数值型。这里给出三种算法,最后一种算法是我个人的算法,也许不是最好,但是提供了一种新的思路。我们还可以用列表推导式,把官方版进一步优化,把代码缩减到五行,大幅提升执行的效率。以上代码,我们只用了五行就得到了我们想要的结果,比官方给出的代码节省了一半。官方版本的优势在于不用导入标准的包,直接用pow()函数来解决。

2023-05-26 17:12:15 44

原创 Python二级编程题《从清华到MIT》

从data.txt文件读入一篇文章,用jieba库的函数Icut的全模式做分词,统计词汇长度为2。的词出现的次数,输出出现次数最多的前10个词汇及其出现次数。

2023-05-26 16:37:55 13

原创 手把手教你用Python调用彩云机器翻译API

第八步,点击【令牌】下面一串字母形成的超级链接,进入到令牌令牌页面,然后可以复制令牌(就是那一串数字和字母组成的字符串),放到Python代码中的token变量的右边。有时我们要它翻译内容较多的文件,可以通过Python来调用它的机器翻译API,突破网页版5000字符的限制。第五步,点击右侧【申请访问令牌】,点击【彩云科技开放平台】进入到开放平台,进行账号申请,同时可以申请彩云小译的API令牌。第一步,我们要进入到彩云科技的主页,如果是第一次登录,就要先注册这个网站,然后再点击顶部的【在线翻译】。

2023-05-25 07:51:59 170

原创 Python批量查询xls文件中是否包括某个关键词

借助于Claude,我很快修改出了代码,可以批量读取当前目录下的xls文件,遍历所有的工作表,同时遍历每一个单元格。针对以上代码,我又进一步思考,考虑用sheet.cell_value(row, col)来查找单元格的内容,这样可以进一步优化循环,减少代码量,加快代码执行的速度。之前用openpyxl只能打开xlsx文件,对于xls文件却束手无策,于时我就想如何解决Excel文件格式限制的问题,最终我选定了xlrd这个读取Excel文件比较快速的模块,并根据Claude提供的代码,给出了初步的解决文案。

2023-05-25 07:51:28 11

原创 用Python求n的平方和小于1000时n最大值

其中n的平方可以写成n**2,也可以写成n*n。用while循环,配合else可以更好地在达到目标时跳出循环,不用另外去干涉程序,不过要注意最后的值要减1,因为题目要求sum的值是小于1000,而不是大于1000。分析:用while...as的写法,当sum的值大于1000时激活else, 打印出n的最大值为n-1。最后求得:n的最大值为14。其实,问题的关键是确定n的值,确定后,问题就好解决了。希望我的方法对你用。

2023-05-22 08:29:38 102

原创 Python批量识别发票信息并自动填写到网上

平时工作中会接触到很多发票,报销前需要把发票的各种信息包括:发票号码、发票代码、校验码、金额等信息录入到报账系统中。如果手机一个个复制粘贴,非常麻烦,而且容易出错,如果采用Python的话则很容易把信息提取到Excel表中,这样再分别录入到网上就快捷多了。我借鉴网上的代码,同时把源代码进行了修改,增加了批量写入Excel文件中的功能,不仅识别率高,而且运行速度快。下面是之前做好一个源码,如果简单修改一下就可以实现读取Excel中的发票信息,然后批量录入到网上,而且还不会出错。

2023-05-21 19:46:48 30

原创 利用列表推导式遍历子目录PDF文件

以上方面有pathlib,os等,可谓是无法八门,但是上面提到的方法用到的代码还是有点儿多,于是,我考虑如何用列表推导式来减少代码,使程序运行的速度更快。第一种方法用scandir(),速度要快于os.walk(),可以获取子目录。第二种方法无法获取子目录,所以当遍历所有子目录时,建议用scandir()。PythonFan:Python遍历子目录文件的多种方法5 赞同 · 0 评论文章正在上传…第四种方法用os.walk()和列表推导式只能得出子目录的文件,不能指定文件属性,因此较为不便。

2023-05-21 19:45:43 426

原创 Python批量合并Excel表

现收集到多个Excel表,需要对这些表进行汇总合并。但是这些Excel表并不规则,有不少空列,而且这些列名虽然一致,但是顺序各不相同,所以汇总起来并不是那么简单。起初考虑用openpyxl,但是由于问题较为复杂,最后决定用os和pandas来解决。以下是合并后的Excel表展示,效果还不错,保持了原为表头和格式,而且排列整齐。第二步:导入pandas,批量读取Excel表,删除空例。合并后的Excel表。

2023-05-15 20:23:11 122

原创 用小牛翻译API让ChatGPT给我做个在线翻译网站

经过测试,上面这段代码有两个问题,一是返回的翻译结果是json格式,不是我们想要的译文,二是打开网页时,这个翻译结果框不显示,显得不是特别好看。这时,我们要请出ChatGPT,设计好我们想要的网页呈现形式,同时还要把我们在小牛翻译上面得到的代码样例,同时在开发过程中,还要在我们的网站上进行测试效果,以期达到我们想到的目标。在上面例子中,我对于生成的译文可以进行译后编辑,也可以再喂给ChatGPT,让它指出我们的语法错误,润色我们的文字,提出进一步修改的意见,这样我们的译文质量就又可以更上一层楼了。

2023-05-07 09:06:12 157

原创 使用Python实现微信群发每日一句

功能:微信群发金山或者海词上的每日一句到指定微信群或者采用kinter 来设计程序界面,用requests和BeautifulSoup来获取金山词霸和海词的每日一句,用控制微信的专属包:wxauto 来操作群发。

2022-11-04 11:20:32 5430 2

原创 利用Python中的requests+wget批量下载微信页面上的音频

我最初学习Python的时候,听过余本国老师的课,学到了一些不错的技巧,也激发了我学习Python的兴趣,今天我再次拿到了以前的代码,经过修改后,变成了一个可以下载微信页面音频的小工具。

2022-09-24 12:16:18 1246

原创 Python辅助作业批改

采用tkinter设计UI的界面,利用pyautogui控制鼠标和键盘,同时也可以定位鼠标点击的位置。4. 进入下一页后,连续点击四下向下的箭头,以定位到作业所在的位置。5. 可以置于所有页面上方,同时提供多个分数选项供选择。3. 自动切换到“进入下一页”Python辅助作业批改升级版。1. 自动定位输入框。

2022-09-18 09:13:21 290

原创 如何解决Embedded Python中无法调用pip

有时我们编写的Python程序无法用Pyinstaller进行打包,或者打包之后运行总是出错,这时我们就要使用Embedded Python,下载这个之后,我们安装pip,然后把所有的包都安装到这个内嵌式python的目录里面,把主程序的py文件也放在里面,然后我们在上一级目录中生成一个bat文件,直接调用python目录里的程序文件,这样我随意移动程序,在没有安装Python的电脑上也可以运行了。

2022-09-04 10:25:21 335

原创 如何学习各种编程的脚本

学习程序的脚本吗?有以下几点建议供你参考:

2022-08-14 08:09:49 498

原创 Python中给字典排序的三种方法(有一种你绝对没见过)

我们经常在计算机等级考试中遇到词频排序的问题,我们一般先通过生成字典的方法,统计词的频次,然后给字典排序。那么如何快速地给字典按照键值进行排序呢?下面介绍三种方法。第一种方法相对比较常见,但是第二种方法你可能第一次见,第三种方法是比较麻烦的一种,你可以参考一下。例:有下面的列表dic={'a':, 'b':, 'c':, 'd':},如何实现字典的升序排列呢?...

2022-08-11 15:27:44 5582

原创 如何用Python下载在线字典上的单词或者短语mp3

用Python批量下载有道词典上的音频

2022-08-11 07:45:10 669

原创 ipython Unhandle exception in look “WinError995 由于线程退出或应用程序请求,已中止I/0操作”

ipython经常报错的问题终于解决。

2022-07-25 17:47:15 724

原创 CSV文本文件导入excel的四种方法

介绍CSV文本文件导入Excel的四种方法

2022-07-15 21:01:35 7839 1

原创 Python 写入XLSX文件的几种方法

Python写入XLSX文件的几种方法。

2022-07-15 14:49:17 4843

原创 BAT文件批量创建目录或docx, xlsx, txt文件

BAT批量文件和文件夹生成

2022-06-15 10:29:10 5818 2

原创 如何把Python列表中的元素重复n次

编程中有时需要把列表中的无素重复显示,这时可以用循环和列表表达式两种方法以。

2022-05-15 13:43:16 3991

原创 Pyinstaller打包后运行错误:Could not find a suitable TLS CA certificate bundle, invalid path 解决方案

用pyinstaller打包python文件中出现以下错误提示:看来是没有找到cacet.pem这个文件,于时我们在以下网址:curl - Extract CA Certs from Mozilla 下载了最新版的: cacert.pem, 此文件我已经下载好了,大家可以在这里下载:http://down.pandengenglish.com/f/364317-542544470-890603下载以后和打包的py文件放在同一个目录下即可以解决问题。参考文章:python 错误 .

2022-02-11 12:34:31 1431

原创 ImportError: cannot import name _elementpath 终极解决办法

在使用pyinstaller打包含有python-docx包的软件时出现以下错误:Failled to execute script XXX due to unhandled exception: cannot import name _elementpath经过查询资料后发现原来是lxml这个文件没有打包进文件,所以在使用pyinstaller时增加以下内容:pyinstaller -F -w XXX.py --hidden-import lxml._elementpath这样再次打包时

2022-02-11 12:05:23 1306

原创 Python批量查单词源码

英语学习必备,Python批量查词典。

2022-02-05 15:53:25 1268 2

原创 快速下载NLTK数据集nltk_data的方法

NLTK是一个非常实用的自然语言处理工具箱,但是其中的数据集下载比较麻烦,而且非常容易中断,有没有快速下载此数据集的方法呢,笔者提供了以下三种方法供大家参考。一、github方法(可以需要代理支持)打开网址:GitHub - nltk/nltk_data: NLTK Data下载压缩包后进行解压。二、使用代理的方法电脑科学上网后,在cmd下运行python,import nltk, nltk.download(), 实现自动下载,如果速度快的话,很快就可以下载到本地,这种方法好处是不用自己.

2022-02-01 18:05:13 3421

原创 如何用Python找出英语和汉语中特定词性的单词

在绘制词云图时,我们有时需要找到特定词性的单词,便云图显示更加精准,本文通过jieba(结巴)库中的posseg和nltk中pos_tag分别对汉英两种字符进行分词、标准,再利用列表表达式进行特定词性单词的提取,演示如下:一、对于英语中的特定词性单词进行提取首先引入nltk中的word_tokenize和pos_tag,对于需要操作字符先分词,再标注,然后再提取。代码如下:from nltk import pos_tag,word_tokenizes="Where do you from?

2022-02-01 17:44:39 2253

原创 无法用requests获取网页源码的解决办法

最近在抓取http://skell.sketchengine.eu网页时,发现用requests无法获得网页的全部内容,所以我就用selenium先模拟浏览器打开网页,再获取网页的源代码,通过BeautifulSoup解析后拿到网页中的例句,为了能让循环持续进行,我们在循环体中加了refresh(),这样当浏览器得到新网址时通过刷新再更新网页内容,注意为了更好地获取网页内容,设定刷新后停留2秒,这样可以降低抓不到网页内容的机率。为了减少被封的可能,我们还加入了Chrome,请看以下代码:from se

2022-01-30 23:29:05 1770

原创 TypeError: __repr__ returned non-string (type bytes) 解决办法

from jieba import possegs="你想去学校填写学生寒暑假住校申请表吗?"words=posseg.cut(s,HMM=False)print([word for word in words])报错如下:Building prefix dict from D:\Program Files\python\lib\site-packages\jieba\dict.txt ...Loading model from cache C:\Users\cflpd\AppDa...

2022-01-14 08:46:39 613

原创 Python辅助批量录入成绩数据

期末时,录错了二个成绩,填了表,找领导签了字,好不容易才改过来。痛定思痛,我就开始思考有没有一种可以在网上自动录成绩的方法呢?进入后数据库,当然不可能,毕竟我又不是管理员,怎么办呢?我就想起了Python这个万能工具。之前,我在网上听讲座,注意到有人用Python通过控制鼠标和键盘来进行信息轰炸,搞恶作剧。我就想,如果我能用Python把Excel表里的数据读取到内存,然后用一个Python包来控制键盘,批量帮助我录成绩,这样就大大减少了我录成绩出错的机率。说干就干,我找了好几个包来试,比如:PyKeybo

2022-01-12 21:36:54 1357 1

Python二级综合应用题:《论语》

二级《论语》文本处理题

2023-06-06

Python批量合并多个doc和docx文件

合并多个数字命名的文件

2023-06-06

Python批量查询海词词典源码

1. 批量查询当前目录下wordlist.txt中的单词发音、词性和语义,并生成wordmeaning.txt,存贮在当前的目录下面。

2022-02-05

定量语料库语言学与R编程:实用导论(英文版)

《定量语料库语言学与R编程:实用导论》Quantitative Corpus Linguistics with R A Practical Introduction。注意是英文版。学习R语言必备的学习丛书。由知名学者Stefan Th.Gries著,欢迎大家下载学习使用。

2020-04-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除