- 博客(33)
- 收藏
- 关注
原创 【复习】利用正则表达式爬取网站的信息
这个函数开始调用之前的那几个函数了,第二行开始,把网址是url的提取出来源代码给muluyedm,第三行,然后调用第五部分代码的函数,从源代码中提取出来标题和内容,第四行,调用第六部分的函数将第三行获取到的值,赋值到第六部分的函数,保存到本地。第七部分的函数就是保存到本地,意思就是,每一个内容页的绝对网址,提取出标题和内容,保存到本地。这个函数意思就是,你给个url网址,它就返回该网址下网页的源代码,实际上在本爬取的过程中,它用到了两次,一次是获取的目录页的源代码,一次是获取的具体内容页的源代码。
2024-07-26 15:33:37 601
原创 用python去爬取小说网址的小说保存到本地全过程
我是买了一本书自己看书去学python的,然后学到了一个章节就是讲的用python去某网络小说网址爬取小说保存到本地,结果我看的这本书比较古老,它举例的这个被爬取的网站已经不存在了,所以,我另外找了一个网站,比着摸索着打代码,中间出现过好多不理解的地方,还有好多地方走了弯路,在此重新整理一下这个代码,尽量说详细一些,给后来的学习者们提供一点灵感吧。
2024-07-21 23:48:39 1329 1
原创 认识一个不一样的python代码if __name__ == ‘__main__‘:
的代码块,那么当这个文件被直接运行时,该代码块内的代码会被执行。但是,如果这个文件被导入到另一个Python文件中,那么该代码块内的代码将不会被执行。这种机制常用于控制脚本的入口点,确保脚本在被直接运行时执行特定的操作,而在被导入时则不执行这些操作。如果没有if__name__='__main__' 前面的hanshu()也不会真正执行,也就是说这个代码是负责运行程序的,类似于print。特别要注意的是name前后的下划线是两个,后面main前后的下划线也是两个!
2024-07-21 20:21:50 283
原创 python多进程库(multiprocessing)
输出的结果=线程设置.map(函数名不含括号,参数集合)上面两行是一个函数,函数有参数,有返回值。设置几个线程,这里设置了3个线程。总结一下这个多线程用法。这里弄了一个参数的集合。这一行表示导入库模块。
2024-07-21 14:49:22 462
原创 使用requests获取网页源代码-python爬虫开发从入门到实践
需要说明的是,re的.search是指的爬取第一个获取到的符合正则表达式规则的内容,后面的.group(1)是指的输出获取到的内容,如果不加这个.group会返回很多很多内容,比如获取到的这个字符的长度,之类的东西,所有要加上.group(1)网页打开方式有很多种,最常见的是get方式和post方式,在浏览器中输入网址的访问属于get方式,但是又有一些页面只能通过某个链接或按钮以后跳过来,不能通过浏览器输入网址访问,这种网页就是用了post方式。这个代码用的是获取网页源代码的方法,格式如下。
2024-07-21 10:58:48 412
原创 用python进行半自动爬虫开发,最简单的一个爬虫程序,新手练习好例子
下面就是用正则表达式对之前获取到的源代码的那些内容进行提取,关于re.findall的用法,请去看我的另外的文章,这里不在提了,我们主要看正则表达式就是re.findall后面括号里的第一个引号里的内容,这个内容就是正则表达式,一共获取了三个内容,一个是用户名,一个是发表的内容,一个是发表的时间,写正则表达式的时候,要看着那个text.txt的源代码进行分析,比如获取用户名时候,我们在源代码里找到这一部分的代码。)" class=""',同样的方法去分析内容和时间的正则表达式,这三句公式相同意思就是,
2024-07-20 11:27:23 689
原创 在python中使用正则表达式
但是第三行的正则表达式有个缺点就是以:开头,以最后一个,结尾,中间还爬取了好多没用的信息,所以我们用了第四行的正则表达式。所以后面输出的效果长度也是2,也仅仅是输出了表示密码的部分。就是把要提取的文本源文件赋值给一个叫wenzhang的变量,当然这个变量名可以自己随便起。点,findall是re模块中的一个方法,findall的使用格式是。就是要寻找的数据的规律,使用正则表达式的步骤有三。第一,寻找规律,第二使用正则符号表示规律,第三,提取信息。‘要爬取文字前面的字符(.*)要爬取文字后面的字符’
2024-07-19 17:54:56 473
原创 pycharm的开头中设置作者开发时间等信息成为模板
就是在pycharm中写代码的时候,开头会有一些代码相关的信息,比如说作者,比如说开发时间等等,如果每次都写比较麻烦,其实pycharm中可以设置成模板,而且时间还会自动更新。二、点编辑器》文件和代码模板》选择 python Script。一,打开pycharm点文件,选择设置。三、在右侧框里输入代码。五、可以加入其它代码。
2024-07-18 21:33:21 474
原创 学习python时候练习的小代码
在B站自己看了一个up主发表的【视频授权发布】视频为为Python中入门基础版(基础语法) 首次发布,最新版Python小白教程,从0开始,针对0基础小白和基础薄弱的伙伴学习,全程干货细讲。实际上我并没有按照老师的讲解敲代码,老师讲的是模拟12306,订票。我按这个思路写的是学生成绩查询,代码基本通用。但是视频里将的东西,么有代码,边学边练,跟着一起敲代码,然后保存下来,和后来学的同学们共享吧。P61 60.实战三,模拟12306车票订票流程。
2024-07-08 21:41:53 202
原创 win10连接不上win7共享打印机该怎么办win10找不到win7共享打印机该怎么办
有许多win10系统客户体现说遇到那样一个状况,便是将打印机共享以后,别的win7系统的计算机都能够立即检索到共享打印机,但是win10系统却找不到,这是怎么一回事呢,下边我们来跟各位说说win10连接不上win7共享打印机该怎么办的解决方案,大家一起来瞧瞧吧。以上便是win10连接不上win7共享打印机该怎么办的解决方案啦,期待能幫助到大伙儿。4、启用SMB1.0/CIFSFileSharingSupport选择项,明确;2.到控制面板中,挑选收看方法是图标,随后点一下程序流程和作用;
2024-05-06 13:43:54 1738
原创 【flash】as2.0制作连线题
例如,我们把“乌龙”两个字变成影片剪辑,选中“乌龙”,按F8转换为元件,类型为影片剪辑,注意对齐的那个九个点,选中最下面一排的中间,也就是连线时候的起始点,如果你是左边连线右边,这个黑点就要选右边中间的那个点。所以我们要求当点击完“乌龙”后,再点击其他文字按钮,其它文字按钮失效,所以我们在3(3)那个第一帧的stop()代码下写入如下代码。(6)测试效果,如下图,测试成功,其它选项也是如此制作,主要写代码时候,代码要对应。(5)回到主场景后,把乌龙的图片转换为按钮元件,并且给这个元件写入代码。
2024-02-13 13:14:38 739
原创 【flash】as2.0利用组件制作单选题
新建一个图层,画一个动态文本框,变量设置为jieguo,用来显示对和错,当然此处也可以插入一个影片剪辑,显示对错,可以参考我们前一篇制作多项选择的例子(当然,这里的fankui影片剪辑只是显示对后的笑与错后的哭的元件,不加也没有问题,就是后面的带fankui的代码去掉即可)9、如果设计了好多个问题,那么每一个问题的关键帧都要把最后一句代码写入,比如第二个问题的单选框的groupName是an2。7,还有一种代码的写法,就是不用提交按钮,选择后直接就显示对或错,这种写法就直接不用做提交按钮了,
2024-02-11 13:30:06 530 2
原创 【flash】as2.0用setInterval实现每隔一段时间执行一次函数
这个代码就是实现的每个多少毫秒执行一次函数,上面是实现的播放下一帧,同样,我们也可以把函数写成其它的事儿,比如每隔多少秒复制一个影片剪辑,代码如下。3测试结果,就是每3000毫秒(就是3秒)就播放下一帧,而且第三帧播放完后,会再次循环播放第一帧。每隔一段时间就执行一次函数,比如,设计一个电子相册,每隔几秒钟就自动播放下一帧。实现的效果,每隔1秒出现一个影片剪辑,做成下雨下雪花的效果应该不错。图层二里第一个关键帧添加的就是实现效果的代码。图层一和图层四里面就是放的不同的图片,2、新建四个图层如下图,
2024-02-11 11:18:19 485 1
原创 【flash】as2.0利用flash组件制作多选题
第一个图层是as图层,第一帧里动作是stop(),用于停止不往后播放,其它两个图层都是空白关键帧,as图层的第二帧是空白关键帧,只是把帧标签设置成了dui,正确显示的图层里放了一个小孩笑的影片剪辑,图层错误显示里是空白帧,第三帧,as图层是空白关键帧,帧标签是cuo,在错误图层里放了一个小女孩哭的影片剪辑。效果基本实现了,就是说当选择了ACDE时候显示dui的那一帧,没有选择这四个选项就显示cuo的那一帧,但是我们的文本jieguo没有显示字,是因为那个字体没有嵌入的原因,修改一下字体就显示啦,完美!
2024-02-10 21:46:50 668 1
原创 【flash as2.0】鼠标滑过图片缓慢移动效果
实现的效果是,有一幅图片,两个按钮,鼠标放到左边按钮上,图片向左移动,鼠标移开后图片停止,鼠标放到右边按钮上,图片向右移动,鼠标移开后,图片停止运动。3、左边按钮实例名称为but2,右边的按钮实例名称是but1,图片实例名称是tutu。如此效果就可以实现了,这是把代码写在了按钮上,当然我们还可以把代码写在关键帧上,4、新建一图层,在新建图层的关键帧里写代码。1、新建一个flash文件,选择as2.2、导入一张图,然后制作两个按钮,如下图。4、在左边按钮上编写动作代码。5、同理右边的按钮编写代码。
2024-02-06 13:12:31 461 1
原创 【flash】flash as2.0做连线题
5、双击进入lxt_mc元件,1选择第一个举头望明月,2右键转换为元件选择影片剪辑,3注册点黑点要点在正中间,否则练习题会在左上角,4点确定,5.给这个影片剪辑起名字q1。8、图层一就是举头望明月的按钮,插入帧共三帧,图层二插入三个空白关键帧。11、双击回到元件1下,选择低头思故乡,右键转换为元件》按钮》确定。7、选择q1举头望明月,双击进去,选择后右键,转换为元件》按钮。9、选择图层一中的举头望明月按钮,右键》动作,加入代码。3、全部选中后右键,转换为元件》影片剪辑》确定。
2023-06-08 15:53:38 655
原创 【flash】flash中导入flv格式的视频问题
1、既然flash CS6只能导入flv格式的视频,那么我们就需要把mp4的视频转换为flv格式,同时还要注意视频和音频的编码。⑶ 输出配置在视频选项卡下,把视频编码改成flv1,把每秒帧数改成和你flashcs6中的帧数相同的数,不然以后生成的视频,导入到flash中会出现画面声音不同步的情况。默认三个复选框都打对号,符合类型可以选嵌入视频,也可以选影片剪辑,如果是嵌入视频,最后在flashcs6里还要建一个影片剪辑元件把视频放进去,所以直接选影片剪辑也可以的。视频是一个mp4格式的视频。
2023-05-06 20:39:10 1196
原创 【flash】利用flash中的函数duplicateMovieClip(),setProperty()制作下雨场景
/ 后面一个参数x为新复制的影片剪辑的深度级别,在这里依次为1、2、3、4、5。在同一时间线上,每一个新复制的影片剪辑占用一个唯一的深度级别,并层层堆叠,如果后复制出的影片剪辑与前面复制出的影片剪辑深度级别相同就会覆盖并替换掉前一个影片剪辑,所以必须为每一个新复制的影片剪辑分配一个唯一的深度级别。//"rain"+i 为新复制的影片剪辑的唯一标识符,这个标识符是由字符串"rain"连接上通过运算取得的i的值得来的,即新复制出的影片剪辑名称依次为rain1、rain2、……//深度级别,可以理解为时间点。
2023-04-06 15:07:09 422
原创 【flash】AS2.0 如何删除元件
2.点开高级,在为action script导出前的方框打上√,给元件1标识符起一个名字,这里我起的是yuanshi,确定。实现的效果:用as2.0加载一个影片剪辑到舞台中,等一秒后该影片剪辑消失。1.库里面有一个影片剪辑元件1,在元件1上点击右键,选择“属性…3.在舞台时间轴上第一帧添加动作。
2023-02-12 11:28:53 489
原创 【flash】Flash的绘图指令的使用
新建文件后,在舞台中绘制一个圆,并将其转为影片剪辑。测试动画会发现,在窗口不同位置上单击就可以画出线段来。要实现画线的流畅,得添加代码啦。玩大一点,如果要拖动两上控制点,并且其画线能任意延长,只需稍加一此代码即可。加在a上的代码一样,有兴趣你可以一试。新建文件,将舞台大小设为400*300,背景为白色。1. 定义直线样式命令:lineStyle(线宽,色彩,透明度)现在用上面介绍的命令在舞台上画一个大小为150*100r矩形。测试动画,这是可以通过拖放鼠标在窗口中自由地绘制线条。
2023-01-08 23:31:25 617
原创 利用openpyxl读取Excel表格中某单元格的内容
利用openpyxl读取Excel表格中某单元格的内容工作需求:读取已经存在的Excel文档中,名字为9月1日的工作表中的A3单元格中的内容。准备工作:Excel文件457.xlsx位于F盘Python文件夹下,已经存在,而且有一个叫9月1日的工作表,表格如下,A3单元格中的内容是“猪八戒”。代码:import openpyxl#引入openpyxl库lujing = r'F:/Python/457.xlsx'#设置路径找到已有的Excel文件457.xlsxxj = ope
2021-09-05 17:52:49 8454 2
原创 利用openpyxl在Excel文件中批量复制模板表格
工作需求:在我F盘下的Python文件夹下有一个叫457的Excel文件,在457.xlsx文件中有一个叫模板的表格,该表格是做好的记录体温的模板,需要在这个457Excel中按照这个模板创建31个工作表,每个表命名为9月1日-9月31日,并删除这个叫模板的表格。准备工作:Python环境、安装openpyxl库,457.xlsx(位于F盘Python文件夹下),457.xlsx中有一个叫模板的表格以及做好,如下图:代码:import openpyxl#引入openpyxl库lu.
2021-09-05 17:38:47 1627
原创 利用for循环、openpyxl批量新建Excel中的表格
要求实现的功能:在指定的路径,新建一个Excel文件,该文件中有7月1日到7月31日共31个工作表。准备:Python环境、安装openpyxl库代码:import openpyxl#引入openpyxl库lujing = r'F:/Python/456.xlsx'#设置路径xj = openpyxl.Workbook(lujing)#创建一个Excel文件for i in range(1,32,1):#从1到32循环 xj.create_sheet('7月'+str(
2021-09-05 16:40:33 2211
原创 Python中tkinter模块的学习记录(一)
听了几节Python的网课,产生了一个疑惑,如果在一个没有安装Python环境的电脑中,如何运行我们的成绩呢?Python能不能做一个EXE格式的可执行文件呢?产生这个问题后,就百度了一下,好像是可以,然后安装了一个什么库,然后生成了一个EXE文件,但是运行的时候,还是像cmd一样,一个黑色的框框,难看,而且并不像一个软件的样子,要改变外观,好像得先学GUI,GUI大体的意思就是图形界面。GUI库有很多,但是tkinter好像是最简单的,我们就拿它先下手吧!第一步,安装tkinter提到库,就是
2021-08-26 21:59:41 2024
原创 Pycharm新建模板默认添加作者时间等信息
在pycharm使用过程中,对于每次新建文件的shebang行和关于代码编写者的一些个人信息快捷填写,使用模板的方式比较方便。 方法如下: 1.打开pycharm,选择File-Settings 2.选择Editor--Color&Style--File and Templates--Python-Script3.编辑内容(a)shebang行#!/usr/bin/python3(b)预定义的变量要扩展为格式为$ {<variable_name&g
2021-08-22 11:23:04 187
原创 用Python删除一个不为空的文件夹程序优化
上一篇自己研究了一下如何用Python删除一个不为空的文件夹,因为没有老师带,所以很多代码也看不懂,朦朦胧胧的,上个程序需要在代码中修改文件夹的路径来删除文件夹,我自己用了一个input函数,可以在控制台输入一个路径就可以删除了,代码如下import os # 引入库import shutil # 引入库path_in = input('请输入文件的路径')Dir = path_in # 这是设定的是文件夹路径,上面的东西不用管,只在这改成要删除文件的文件夹路径就行了。if os.pat
2021-08-21 12:57:47 286
原创 Python中os模块删除某个文件夹中所有的文件
用Python中的os模块删除电脑中某个文件夹中所有的文件。import os #引入库import shutil #引入库def CleanDir( Dir ): #声明一个叫cleandir的函数,函数的参数是dir if os.path.isdir( Dir ): #os.path.isdir()函数判断dir是否是一个目录,同理os.path.isfile()函数判断是否是一个文件。 paths = os.listdir( Dir )#os.listdir() 方法
2021-08-21 10:58:04 5648 1
原创 PyCharm2021设置成中文版
刚刚安装了pychram后,发现菜单栏啥的都是英语,对于英文不好的我来说,看了就头大,于是就想着是不是有什么汉化版的pychram,于是搜索了一下,发现pychram2021已经自带了汉化的版本,下面就是设置成汉语版的方法:PyCharm 界面:安装 PyCharm 中文插件,打开菜单栏 File,选择 Settings,然后选 Pulgins,点 Marketplace,搜索 chinese,然后点击 install 安装:...
2021-08-19 23:03:48 6252 1
原创 【Python】No module named ‘win32com‘解决方法
在pycharm中运行某py,提示E:\Python\python.exe F:/浏览器下载/ReplaceDocxAndXlsxAndTxt/ReplaceDocxAndXlsxAndTxt/replaceDocxAndXlsxAndTxt.pyTraceback (most recent call last): File "F:\浏览器下载\ReplaceDocxAndXlsxAndTxt\ReplaceDocxAndXlsxAndTxt\replaceDocxAndXlsxAndTxt.p
2021-08-16 10:43:51 31807 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人