自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 谷歌浏览器插件Automa_5.数据存储及保存

点击红色标注,出现的窗口就是表格了。你可以把这部件理解为excel表格,然后你可以使用其他组件往表格中的某一列插入数据。点击添加可以为这表格的表头添加一个属性。如果你熟悉数据库的话,这个添加就是往表中添加属性字段。

2023-05-01 02:09:46 1932 5

原创 谷歌浏览器插件Automa_4.元素多选

首先,这章是为数据爬取做铺垫的。在爬取过程中,我们总是会遇到排版工整的结构,面对这种情况,总不可能一一获取它们的定位吧。这时,我们就可以批量选择这些元素,以获得它们的定位。

2023-04-30 01:17:01 948 1

原创 谷歌浏览器插件Automa_3.点击输入小练习之百歌搜索

一般选择元素的id、name,之后便在表单中选择css selector模式,在指定位置输入[name=‘q’],半角符号,然后选择元素为“文本框”,并在指定位置输入“stack……4.最后,由于404网站的搜索按钮被隐藏,这里采取一种比较取巧的方法,默认搜索按钮为[type=‘submit’],绝大部分情况下都可以运行。3.接下来便是爬虫中最重要的一步,确定元素,并对其进行操作,这里则对输入框进行输入操作。2.其次是打开需要爬取的网页,在指定地方输入网址,需要的可以在“描述”中写注释。

2023-04-29 00:23:17 515

原创 谷歌浏览器插件Automa_2.点击和输入文字

普通玩家对于组件的操作无非就,但高端玩家会为这些操作加上各种限制条件以让其适应各种网页,而这些内容将在进阶篇介绍。

2023-04-29 00:12:42 2285

原创 谷歌浏览器插件Automa_1.定位

这段话是对小白说的:机器并没有智能,它只是个你叫他洗碗他就绝对不会洗锅的机器,所以你要想好你的每一步鼠标操作、键盘操作和位置,把所有操作都告诉机器,它就能做好所有事情。这里先讲解位置。这里有两种定位方法:CSS选择器、Xpath选择器如果你是个编程小白的话则不需要考虑两者的区别,甚至乎高手也不考虑两者的区别,可口可乐和百事可乐的区别只有一群脑残粉互杠。

2023-04-29 00:05:22 892 2

原创 谷歌浏览器插件Automa_0.自我见解及官方文档

很抱歉在开头就泼你一盆冷水,遗憾地说Automa并不完美,或许是因为其有待成长(每次打开都会发现变了个样),但其所见即所得的体验依旧深深吸引着我。(因edge全局快捷键的完善,我现在从chrome转入到edge)

2023-04-28 23:53:25 1782

原创 python的instagrapi方法文档

机翻,部分翻译润色,也可能缺少了几个方法。

2023-04-28 02:34:34 270

原创 呼吸机压力预测——方案复现(连载中)

Google Brain - Ventilator Pressure Prediction

2023-04-08 20:37:14 191

原创 同行者科技Python开发工程师校招笔试题

感觉自己就是个傻子,最大频率栈,傻乎乎写了半个小时,最后一查,不是用字典存储计数,而是用列表存储计数,而且妙就妙在重复存储在增加一点点空间复杂度的同时,大大降低时间复杂度。5.n个人(编号1~n)围成一圈从编号为1的开始报数,从1报数到m,报到m的人出来,下一个人继续重新从1开始报数,编程求最后一个留下的人的编号。我反正是掐着点全部写出来了,平均一题12分钟,连带打代码和调试,但还是挂了,不理解。但是这里题目没说要返回什么,为了保险起见我返回了下标,但是时间复杂度会复杂,不过代码也会复杂。

2023-04-07 15:23:05 337 1

原创 centos7安装PostgreSQL,配置远程连接

安装、远程配置

2023-01-19 14:26:47 956

原创 ubuntu断网、网络设置消失的解决办法

ubuntu断网、网络设置消失的解决办法。

2022-11-09 21:43:51 4923

原创 Ubuntu20.04配置iotDB

iotDB安装和个人见解

2022-11-07 20:42:09 1026

原创 pyspark中jieba的使用问题

spark使用jieba分词

2022-06-10 17:33:00 802

原创 pyspark划分数据集后一列数据丢失

pyspark划分数据集后丢失一列数据

2022-06-08 23:11:20 179

原创 sqlserver Microsoft visual studio多维数据集浏览器无法打开excel

sqlserver Microsoft visual studio多维数据集浏览器无法打开excelMicrosoft visual studio多维数据集浏览器无法打开excel

2022-05-01 00:46:10 1172

原创 vscod卡死在Maven: Generating project in Interactive mode

Maven: Generating project in Interactive mode

2022-02-15 20:42:02 1264

原创 谷歌浏览器插件Automa(入门,编写中,开专栏填坑中)

一般选择元素的id、name,之后便在表单中选择css selector模式,在指定位置输入[name=‘q’],半角符号,然后选择元素为“文本框”,并在指定位置输入“stack……可以看到这个功能叫做元素选择器,你可以使用它来定位输入框、按钮、又或者一张图片,一个序号,只需点击网页中的任意一个你想点击的位置,它都可以提取出所对应的CSS。,在想要点击处右键,点击检查,这时会弹出网页对应处的html代码,在代码突出显示处右键,复制xpath(经测试,Automa对xpath的多元素支持并不完善)。

2022-01-07 23:39:59 21343 10

原创 ‘Unable to connect to any servers‘, {‘172.0.0.1:9042‘: OSError(None, “Tried

首先请确认Cassandra服务开启接着确认为本地单机部署“错误”代码cluster=Cluster(['127.0.0.1'])session=cluster.connect()错误提示(无法复现)'Unable to connect to any servers', {'172.0.0.1:9042': OSError(None, "Triedied connecting to—……就很奇怪,明明没错的,然后试了试localhost,运行成功!!!cluster=Cluster(['

2021-10-17 00:06:58 632

原创 ValueError: check_hostname requires server_hostname

结论:关闭fiddle代理在学校上python网络爬虫时,课程使用工具是Fiddler,并且在浏览器上安装相应插件,但是在上实验课时,出现了以下问题raise ValueError("check_hostname requires server_hostname")ValueError: check_hostname requires server_hostname在搜索过后,查到两个可能的原因,一个是...

2021-09-08 23:48:54 393 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除