自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 提取文件名

记事本全部提取文件夹的文件名的方法:(1)打开记事本;(2)输入代码:dir *.* /B >xxx.txt(3)另存到指定文件并把扩展名txt改成bat;(4)双击bat文件;(5)打开生成的文本文件并把制作的bat文件和文本文件删除;(6)复制文件名到word或Excel文档并保存。

2024-07-16 17:06:10 285

原创 图片链接批量转成图片

5、再将txt文本中的所有链接,复制到表格的 D列。1、所有的链接复制到表格中,例如复制到 B列。4、将C列表格的内容复制到一个txt的文本中。7、然后,全选图片,右键,将图片嵌入表格中。6、稍等片刻,变成图片。3、双击 C列 表格。

2023-08-31 16:23:17 6268 2

原创 tableau 为什么有数据, 没有图

一般是因为破解版建议试用14天试用版学习.

2022-04-12 17:06:35 7662

原创 谷歌浏览器-XPath Helper 打开快捷键

谷歌浏览器,快捷键ctrl + shift + x, 即可打开XPath Helper

2021-12-08 15:06:01 2043 5

原创 获取图片的xpath

# 如果不存在piclibs文件夹,那就新建一个. if not os.path.exists('./Libs'): os.mkdir('./Libs') for li in li_list: img_src='https://pic.netbian.com/'+li.xpath('./a/img/@src')[0] # 局部解析 @src img_name=li.xpath('./a/img/@alt')[0]+'.jp.

2021-09-22 17:40:14 338

原创 selenium: 爬取链接的方法

element=bro.find_element_by_xpath('//[@id="J_goodsList"]/ul/li[1]/div/div[3]/a[@href]')print(element.get_attribute('href'))

2021-09-22 12:20:12 1655

原创 重新安装python

cd进入python位置:先安装 pinpython -m ensurepip更新 pinpython -m pip install --upgrade pip

2021-09-13 23:32:32 266

转载 python遍历txt文件的 5种方法

#方法一:直接遍历法,按行读取,每行返回一个字符串类型f1= open("C:/Users/Administrator/Desktop/qj_ly_product_list.txt",'r',encoding= 'UTF-8')for i in f1: print(i,end = '')#方法二::read法,如果指定了参数 size,就按照该指定长度从文件中读取内容.否则,可以一次读取文件的全部内容,Python把内容读到内存,用一个str对象表示,被读出来的内容,全部塞到一个字符串里面..

2021-09-13 11:47:55 10651 1

转载 selenium: xpath 选择元素

绝对路径: /elements = driver.find_elements_by_xpath("/html/body/div")css表达式html>body>div相对路径: //elements = driver.find_elements_by_xpath("//div//p")如果使用CSS选择器,则为divp通配符: /如果要选择所有div节点的所有直接子节点,可以使用表达式//div/**是一个通配符,对应任意节点名的元素,等价于...

2021-09-06 18:18:46 440

转载 selenium: 鼠标右键点击、双击、移动鼠标到某个元素、鼠标拖拽

通过 Selenium 提供的ActionChains类来实现from selenium import webdriverdriver = webdriver.Chrome(r'f:\chromedriver.exe')driver.implicitly_wait(5)driver.get('https://www.baidu.com/')from selenium.webdriver.common.action_chains import ActionChainsac ..

2021-09-06 14:16:08 3253

转载 selenium 窗口切换

切换到frame使用 WebDriver 对象的 switch_to 属性, frame_reference 可以是 frame 元素的属性 name 或者 IDwd.switch_to.frame(frame_reference)比如这里,就可以填写 iframe元素的id ‘frame1’ wd.switch_to.frame('frame1')或者 name属性值 ‘innerFrame’wd.switch_to.frame('innerFrame')也可以填写fr..

2021-09-06 13:35:52 527

转载 selenium 中 css-寻找元素

等同于 tag名,不改变.elements = wd.find_elements_by_css_selector('div')elements = wd.find_elements_by_tag_name('div')id值, 加上#: #id值element = wd.find_element_by_css_selector('#searchtext')element.send_keys('你好')class值, 加上. : . class值elements = ...

2021-09-06 11:41:38 685

转载 selenium 中 普通-寻找元素

# 导入Select类from selenium.webdriver.support.ui import Select# 创建Select对象select = Select(wd.find_element_by_id("ss_single"))# 通过 Select 对象选中select.select_by_visible_text("老师")...

2021-09-06 10:21:50 153

原创 selenium 中页面刷新-等待

加入:wd.implicitly_wait(10)

2021-09-06 10:12:06 524

原创 json格式转成表格格式

import jsonimport pandas as pddf=pd.read_json('./公告遴选苏州.json',lines=True,encoding='utf-8')# print(df.columns)cols=list(df.columns)# 先删除,然后移动,标题交换cols.insert(0,cols.pop(cols.index('招标人')))# 内容交换,通过索引赋值df=df.loc[:,cols]# 创建一个表格df.to_excel('./wang.

2021-08-24 11:39:13 1478

原创 保存文件到本地

1.文字保存成文档h_list=etree.HTML(page_text)div_list=h_list.xpath('//section[@class="list"]/div')fp=open('5.txt','w',encoding='utf-8')for div in div_list: title=div.xpath('./a/div[2]/div/div/h3/text()')[0] fp.write(title+'\n')2. 图片保存到文件夹# 如果不存在.

2021-08-24 11:37:46 121

原创 scrapy 图片下载不了到本地

显示错误: DEBUG: Crawled (301)处理:在setting中加上: MEDIA_ALLOW_REDIRECTS = True

2021-08-23 21:21:25 303

原创 清除终端 Terminal 的代码 快捷键(清屏)

直接输入 Ctrl+L

2021-08-17 12:00:01 2441 1

原创 selenium: 网页打开最大化

# 打开网页最大化bro = webdriver.Chrome()bro.maximize_window()

2021-08-15 20:53:50 660

原创 selenium: 全屏往下拉

for i in range(100): js = 'window.scrollTo(0,%s)'%(i*100) bro.execute_script(js) sleep(0.5)

2021-08-13 10:49:53 83

原创 Python数据输出为表格的形式

1、安装 : pip install mysqlclient2、pandas

2021-08-04 14:22:43 2462

原创 xpath 空文档

1、检查xpath中是否有tbody如://*[@id="main"]/div[2]/table/tbody/tr[2]/td/table/tbody/tr[3]/td[2]有tbody,只需要将 tbody 删掉即可。

2021-08-04 14:11:06 165

原创 文本乱码的情况

方法一:response=requests.get(url=url,headers=headers)response.encoding='utf-8'page_text=response.text方法二:只需要针对乱码的属性值处理就行。img_name=li.xpath('./a/img/@alt')[0]+'.jpg'img_name=img_name.encode('iso-8859-1').decode('gbk')...

2021-08-04 11:31:48 162

翻译 Python 快捷键

编辑(Editing)Ctrl + Space 基本的代码完成(类、方法、属性)Ctrl + Alt + Space 快速导入任意类Ctrl + Shift + Enter 语句完成Ctrl + P 参数信息(在方法中调用参数)Ctrl + Q 快速查看文档Shift + F1 外部文档Ctrl + 鼠标 简介Ctrl + F1 显示错误描述或警告信息Alt + Insert 自动生成代码Ctrl + O 重新方法Ctrl + Alt + T 选中Ctrl + / 行注释Ctrl + Shift + / 块

2021-07-27 14:09:25 133

原创 批量添加 引号 ‘ ‘

Ctrl+r#调出正则匹配工具栏第一个空填入:(.*?):(.*)第二个空填入:'$1':'$2',

2021-07-27 14:07:45 328

原创 网页爬取xpath 报错:list index out of range

爬取网页地址,要去掉 text ,网页不是文本数据

2021-07-24 18:26:29 1000

原创 xpath解析报错:lxml.etree.XPathEvalError: Invalid expression

反斜杠的问题for li in li_list: img_src=li.xpath('.a/img/@src')for li in li_list:img_src=li.xpath('./a/img/@src')

2021-07-22 13:08:36 1350

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除