自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 如何调用星火API,将语言大模型部署到本地

星火API(Spark API)是Apache Spark框架提供的一组编程接口,用于处理大规模数据集。通过调用星火API,开发人员可以在分布式计算环境中实现各种数据处理和分析任务,如数据清洗、转换、聚合、机器学习等。

2024-07-13 08:12:06 904

原创 selenium元素定位八种方法

元素定位是指准确定位和操作网页中的元素,是Selenium自动化测试中的关键步骤之一。只有正确的元素定位才能对目标元素进行操作。一般来说,单一元素定位采用XPATH或CSS选择器较为方便;如果同时定位多个元素,使用标签或标签属性更为直接、方便。

2024-06-05 20:21:12 559

原创 Selenium常用自动化操作

Selenium是一个强大的、开源的Web应用程序自动化测试工具,它允许用户编写脚本以自动操作网页及其元素,模拟真实用户的行为进行测试。理论上,我们对浏览器的操作动作,都可以通过selenium来完成。下面介绍selenium常用工具包和常用操作。

2024-06-05 19:42:46 145

原创 【使用Selenium自动爬取京东商品评论】

爬取京东商品评论,了解消费者满意度。

2024-06-03 17:46:02 211

原创 【老胡真的爱胡说吗?如何爬取新浪微博数据】

如何爬取新浪微博等动态网页数据?以老胡微博为例。老胡是微博大名人,广受欢迎,拥有两千多万粉丝。我们想先爬取老胡近半年的微博,然后利用文本分析方法看看老胡的微博具有怎么样的特征,为什么能有这么多人喜欢。

2024-05-26 23:23:49 485

原创 利用python自动批量打印

一个自动化批量打印小程序,不用点开文件逐个打印,非常省时省麻烦。

2024-05-20 16:03:32 285

原创 练习正则法则,爬取豆瓣电影top250

通过爬取豆瓣电影top250,学会使用正则表达式。

2024-05-18 22:39:27 212

原创 正则法则常用必备四个知识点

python正则表达式是一个强大的工具,我们掌握最常用的几个知识点。

2024-05-15 06:44:40 365

原创 python怎么爬取图片--以豆瓣电影top250为例

用python爬取图片

2024-05-15 06:32:27 157

原创 利用python怎么爬取pdf文件-上市公司年报

以爬取贵州茅台年报为例,python获取pdf文件非常简单。需要注意的是,数据存储是二进制形式,文件保存为.pdf后缀。

2024-05-14 08:08:41 197

原创 python常见的错误类型

python中常见的错误。学会阅读常见错误,根据错误提示修改代码,这非常重要。

2024-05-14 08:01:25 338

原创 快速爬取证券日报新闻

快速爬取证券日报新闻,及时了解市场动态。

2024-05-06 19:53:00 202

原创 python如何爬取链家二手房数据

使用python练习爬取静态网页数据:以爬取链家二手房信息/房价为例

2024-04-29 22:03:29 348

原创 第二讲:python使用requests请求网页的五种简单方法

python使用requests请求网页的五种简单方法——以链家网站为例

2024-04-29 21:44:55 456

原创 知网论文爬取以及如何优雅地一键爬取知网优秀期刊论文

如何优雅地一键爬取知网优秀中文期刊论文

2023-12-03 17:50:05 701

原创 Selenium 手动安装方法

Selenium 手动安装方法。国内下载不方便的朋友,可以从我的。上面这种手动方法是常规方法失效时才采用的,建议首先考虑。

2022-11-27 16:26:33 1738

原创 【如何修改sublime text默认颜色】

如何修改sublime text默认颜色

2022-11-24 23:16:21 2997 1

第一讲:python网络爬虫基础知识

本讲主要内容包括Python常见数据类型、循环与控制流以及常见的错误处理方法。这些Python基础知识非常重要,是后面进行爬虫练习必备也是最少基础内容。

2024-04-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除