不会射门的18号-CSDN博客

原创一个镜像下载网站，下载速度快，包括centos,ubuntu等镜像

阿里巴巴开源镜像站-OPSX镜像站-阿里云开发者社区 (aliyun.com)

2024-01-04 09:32:29 436

原创爬虫源码---爬取自己想要看的小说

小说作为在自己空闲时间下的消遣工具，对我们打发空闲时间很有帮助，而我们在网站上面浏览小说时会被广告和其他一些东西影响我们的观看体验，而这时我们就可以利用爬虫将我们想要观看的小说下载下来，这样就不会担心广告的影响了。

2023-09-04 23:12:09 7564 34

原创爬虫源码---爬取小猫猫交易网站

本片文章主要对爬虫爬取网页数据来进行一个简单的解答，对与其中的数据来进行一个爬取。

2023-09-03 23:21:23 10818 46

原创爬虫--爬取自己想去的目的的车票信息

本篇文章主要作为一个爬虫项目的小练习，来给大家进行一下爬虫的大致分析过程以及来帮助大家在以后的爬虫编写中有一个更加清晰的认识。

2023-09-01 23:27:45 10983 31

例如最初创作的初心便是记录一下自己的学习笔记，不知不觉已经创作的几十篇文章了，也收获了许多的阅读量，让我对创作博文有了更加的强烈的热情，我也会去创作更多的博文来记录自己的学习。在实习期间也创作的自己的博文来记录自己的学习情况，来帮助我对自己的学习有着更加好的关注度，让我有一个更好的学习习惯，对自己的知识有一个更加好的整理。在创作的期间也收获了许多志同道合的朋友，也学习到了许多大佬的创作技巧，也收获了一些粉丝，这对我的创作有了很大的帮助。

2023-08-29 19:35:34 151 1

原创爬虫练习源码

利用爬虫爬取电影票房榜数据。

2023-08-15 22:14:41 521 39

原创爬虫练习源码

【代码】爬虫练习源码。

2023-08-14 21:39:12 474 4

原创爬虫练习源码

利用XPATH语句解析电影数据。

2023-08-13 20:15:31 509 4

原创爬虫---练习源码

选取的是网上对一些球员的评价，来评选谁更加伟大一点。

2023-08-04 18:24:13 1331 10

原创爬虫-requests-cookie登录古诗文网

难点：我们在进行登录时观察到与许多参数，我们要对参数进行分析，在分析的时候我们发现了三个变化参数分别是VIEWSTATE， VIEWSTATEFENE， CODE。而且我们在对登录页面解析时，并不能找到VIEWSTATE， VIEWSTATEFENE，而这样的参数一般就会放在被隐藏在页面源码之中，我们需要去对页面源码解析并获取数据，这也是现在网站喜欢用的一个反扒手段。而且古诗文网的登录页面采用动态验证码来登录，我们考虑的时获取每次登录时产生的随机验证码图片，手动输入验证码来进行登录。

2023-07-29 22:59:57 1019 1

原创 selenium交互代码

Selenium是一款强大的Web自动化测试工具，可以模拟用户在浏览器上的操作以及与页面元素的交互。在本文中，我们介绍了如何进行页面数据及元素的交互，其中代码示例演示了如何使用Selenium搜索并点击百度的下一页，读者可以根据自己的需求进行修改。对于需要进行Web自动化测试的开发者来说，Selenium提供了一种方便的测试方式。通过使用Selenium，可以快速地检验页面的功能性以及稳定性，提高测试效率，保证网站的质量。

2023-07-28 22:10:17 900

原创 selenium定位元素的方法

Selenium可以驱动浏览器完成各种操作，比如模拟点击等。要想操作一个元素，首先应该识别这个元素。人有各种的特征（属性），我们可以通过其特征找到人，如通过身份证号、姓名、家庭住址。同理，一个元素会有各种的特征（属性），我们可以通过这个属性找到这对象。网上的find_element_by_xxx方法可能会出现不匹配的方法，所以我用的最新方法。下面我们利用百度网站来进行元素定位的操作。

2023-07-27 23:15:55 576

原创 JSONPATH简单入门语法

JSONPath语法和XPATH语法对比 JSON结构清晰，可读性高，复杂度低，非常容易匹配。JSONPath的语法与Xpath类似，如下表所示为JSONPath与XPath语法对比。2：所有的作者(由于文件中有多个指标，所以我们可以查询多指标里面的信息)我们在使用jsonpath的时候首先需要去安装jsonpath。4:store里面所有的price。3:store下面的所有元素。8：过滤出所有含isbn的书。9：那本书超过了10块钱。1：查询所有书店的作者。

2023-07-24 13:31:28 195 1

原创 xpath解析HTML文件

XPath是一种用于选择XML文档中节点的语言，它可以通过路径表达式来定位节点。由于HTML文档的结构与XML文档类似，XPath也可以用于解析HTML文档。XPath的路径表达式类似于文件系统中的路径，它用于描述节点在文档树中的位置。标签名：标签名用于描述节点的类型，它可以是HTML标签名或XML标签名。例如，img表示图片节点，a表示链接节点。轴：轴用于描述节点与当前节点的关系，它可以是父节点、子节点、兄弟节点等。//：查询所有子孙节点，不考虑层级关系。谓词：谓词用于描述节点的属性或位置。

2023-07-23 23:52:44 438

原创最新版edge浏览器中安装xpath插件

最近在跟着尚硅谷进行爬虫的学习，老师给出了在谷歌浏览器安装Xpath插件的方法，由于电脑上面未安装谷歌浏览器，所以在网上搜索了在edge上安装Xpath插件的方法，安装完成以后发现使用快捷键 CTRL +SHIFT+X不能够打开，以为是自己安装错误，后面才知道是和浏览器自身的快捷键冲突，浏览器的快捷键也不能更改，又去搜索了方法，发现更改Xpath的配置文件来更改就可以了。2：打开浏览器的扩展(点击edge右上角的“...”，选择扩展)4：点击加载解压缩的扩展，然后选中你的解压文件。

2023-07-22 23:57:52 6872 10

原创爬虫-微博个人主页的获取

我们在利用爬虫爬取微博个人主页的时候，我们需要获取到个人页面的cookie才能进入到微博的个人主页，否则的话将会是一直跳转到登录页面而导致不能进入个人主页。在爬取完生成的HTML中，我们可以直接点击浏览器标识就可进入页面了。

2023-07-21 13:45:36 1057 2

原创爬虫的编解码方式

我们在对爬取一个网页的时候，我们复制了这个网页的地址，但我们发现在将他粘贴下来以后不会是汉字，而是一串字符，这时候，我们需要去对字符进行编码，以便于我们能够继续去爬取网页。我们可以看到源码是带有汉字的，然后我们在进行爬取的时候会出现字符，这时候我们就需要去进行编码。我们在获取user_Agent的时候对页面进行检查就可以获取了。在利用urlencode方法的时候，我们需要定义一个字典存储信息。这是最近学习的一些东西，简单记录一下。get请求的urlencode方法。get请求的quote方法。

2023-07-20 15:07:13 701 1

原创第一阶段完成

终于是拿到了!!!

2023-07-11 16:39:19 71 2

原创表白爱心代码

【代码】表白爱心代码。

2023-07-09 20:12:43 113

原创 python爬取图

【代码】python爬取图。

2023-07-08 20:30:05 49

原创 python爬虫源码

【代码】python爬虫源码。

2023-07-07 22:07:36 782

原创 python实现水仙花数

【代码】python实现水仙花数。

2023-07-02 20:58:07 272

原创找实习的感想

由于自己马上大四了，找一个实习对自己以后找工作会有比较大的帮助，所以就准备暑假去找一个和自己专业相关的实习，自己也投了几份简历，但都没有得到面试的机会。1：简历的深度不够，简历不能够去打动面试官给你面试的机会，别人的简历比你更加优秀，更能打动面试官。2：能力不够，自己对专业知识掌握的不够，不能去胜任公司的工作。我们不能够让自己输在的起点。

2023-07-01 22:20:43 68

原创爬虫学习笔记

爬虫最重要的就是需要获取URL地址，以便于来爬取我们需要的网页数据。post获取网页内容。

2023-06-30 21:11:59 464

原创情感词云图

微博的评论有积极的也有消极的，我们可以利用读取的微博评论绘制出词云图来分析消极与积极情绪。首先我们需要去读取我们截取的微博评论，并利用jieba库对评论进行分词。我们在对评论分好词以后就需要对里面的停用词进行处理，去除不需要的停用词。做好停用词处理以后就可以绘制情绪词云图了。

2023-06-23 20:09:33 131

原创 jupyter运行代码时运行速度慢的问题

5:选择优化过的工具：如果您的任务适合不同的工具或平台，可以尝试使用针对特定任务优化过的工具。例如，如果您需要使用GPU进行深度学习训练，可以考虑使用PyTorch或TensorFlow等深度学习框架，这些框架为GPU优化过。1:修改Notebook内核(或Runtime)的资源分配：将CPU、GPU、内存等资源的分配适当地调整到适合您的任务和机器的级别。4:关闭其他程序：如果在计算机上同时运行多个程序，可能会影响Jupyter的运行速度。您可以尝试使用更快的算法，调整超参数，或优化特定的代码段。

2023-06-22 00:38:48 5526

xpath插件的压缩包

大数据专业应该朝那个方向发展?