- 博客(5)
- 收藏
- 关注
原创 python自动化工具selenium之抓取某视频网站
这里我的思想是直接抓取推荐页面的视频数据,我发现当前视频的url都在这个标签的src属性中,于是我们就可以去抓取当前视频的url数据,拿到之后再利用我们的lxml库去抓取视频链接,再用request库去下载我们的视频。但是后面想了一下我不能只抓一个视频,于是再去找找这些视频的url有什么规律,后面我发现了,就是当前页面我们搜索标签可以得到3个,3个当中都有一个视频url,且都对应着我们这个视频。当我用ActionChains动作链去点击我们键盘下键,实现翻页时,又会得到一个新
2023-12-03 19:50:15 1814 1
原创 python文件系统设计及模块OS操作
这里的话,主要还是导包,调库,然后管理我们的文件及文件夹,这里每做完一个操作都需要显示当前目录下的文件架构!这里读的话,其实是全读F.read()。这里文件的读其实还有一钟类似与指针的函数seek()和tell()函数,一个是将读指针移位,一个是查看当前读指针的位置,用起来也是相当方便!F=open("文件名或者路径+文件名","写模式【w,w+等等】",encoding="编码格式【一般就utf-8】")我们看了一下,基本上就是创建文件,文件夹,删除文件,文件夹,查看文件内容,查看文件构架!
2023-12-02 22:07:50 989 1
原创 用python进行语法分析,第一步用python求出first集和follow集。
本文的中心思想就是定义好两个字典FIRST,FOLLOW集合,用这两个字典去装我们的FIRST集合与FOLLOW集合.后面就是定义相应的函数求解给定文法的FIRST集合与FOLLOW集合。这两个集合我们都进行了去重操作,把集合的重复元素给去了。其实还是应该说就是根据求FIRST集合与FOLLOW集合的原理去求,定义相应的函数,最后把结果放入相应的集合,去重!
2023-11-05 16:56:48 384
原创 用python来实现一个简单的词法分析器
本来的思路是写一个自动机,用一个指针来表示当前读取的字符,另一个指针往后读,通过不同读取字符的状态用自动机来确定是哪种类别。后面由于python指针好像只要那个seek(),tell()函数好像不是很好操作,于是就想到另一种方法就是使用正则来匹配我们的文件内容,找出我们需要识别的词,同时输出单词的类别!其实上述代码就是通过定义不同匹配单词类型的函数,如1.字符串类(包含了标识符和关键字)正则匹配到之后可以先判断是否为关键字,剩下的就是标识符。2.数字类,就直接正则匹配就好。这里用到的都是c语言的关键字...
2023-10-22 19:25:13 512 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人