- 博客(17)
- 收藏
- 关注
原创 如何调用星火API,将语言大模型部署到本地
星火API(Spark API)是Apache Spark框架提供的一组编程接口,用于处理大规模数据集。通过调用星火API,开发人员可以在分布式计算环境中实现各种数据处理和分析任务,如数据清洗、转换、聚合、机器学习等。
2024-07-13 08:12:06
904
原创 selenium元素定位八种方法
元素定位是指准确定位和操作网页中的元素,是Selenium自动化测试中的关键步骤之一。只有正确的元素定位才能对目标元素进行操作。一般来说,单一元素定位采用XPATH或CSS选择器较为方便;如果同时定位多个元素,使用标签或标签属性更为直接、方便。
2024-06-05 20:21:12
559
原创 Selenium常用自动化操作
Selenium是一个强大的、开源的Web应用程序自动化测试工具,它允许用户编写脚本以自动操作网页及其元素,模拟真实用户的行为进行测试。理论上,我们对浏览器的操作动作,都可以通过selenium来完成。下面介绍selenium常用工具包和常用操作。
2024-06-05 19:42:46
145
原创 【老胡真的爱胡说吗?如何爬取新浪微博数据】
如何爬取新浪微博等动态网页数据?以老胡微博为例。老胡是微博大名人,广受欢迎,拥有两千多万粉丝。我们想先爬取老胡近半年的微博,然后利用文本分析方法看看老胡的微博具有怎么样的特征,为什么能有这么多人喜欢。
2024-05-26 23:23:49
485
原创 利用python怎么爬取pdf文件-上市公司年报
以爬取贵州茅台年报为例,python获取pdf文件非常简单。需要注意的是,数据存储是二进制形式,文件保存为.pdf后缀。
2024-05-14 08:08:41
197
原创 Selenium 手动安装方法
Selenium 手动安装方法。国内下载不方便的朋友,可以从我的。上面这种手动方法是常规方法失效时才采用的,建议首先考虑。
2022-11-27 16:26:33
1738
第一讲:python网络爬虫基础知识
2024-04-22
Typora配置哪个云床图好?哪个更便宜又好用?
2022-11-26
Typora上传图片到图床后后无法在文档中显示
2022-11-26
TA创建的收藏夹 TA关注的收藏夹
TA关注的人