joy_oc-CSDN博客

原创提取文件名

记事本全部提取文件夹的文件名的方法：（1）打开记事本；（2）输入代码：dir *.* /B >xxx.txt（3）另存到指定文件并把扩展名txt改成bat;（4）双击bat文件；（5）打开生成的文本文件并把制作的bat文件和文本文件删除；（6）复制文件名到word或Excel文档并保存。

2024-07-16 17:06:10 304

原创图片链接批量转成图片

5、再将txt文本中的所有链接，复制到表格的 D列。1、所有的链接复制到表格中，例如复制到 B列。4、将C列表格的内容复制到一个txt的文本中。7、然后，全选图片，右键，将图片嵌入表格中。6、稍等片刻，变成图片。3、双击 C列表格。

2023-08-31 16:23:17 6593 2

原创 tableau 为什么有数据, 没有图

一般是因为破解版建议试用14天试用版学习.

2022-04-12 17:06:35 7747

原创谷歌浏览器-XPath Helper 打开快捷键

谷歌浏览器，快捷键ctrl + shift + x, 即可打开XPath Helper

2021-12-08 15:06:01 2064 5

# 如果不存在piclibs文件夹,那就新建一个. if not os.path.exists('./Libs'): os.mkdir('./Libs') for li in li_list: img_src='https://pic.netbian.com/'+li.xpath('./a/img/@src')[0] # 局部解析 @src img_name=li.xpath('./a/img/@alt')[0]+'.jp.

2021-09-22 17:40:14 344

原创 selenium: 爬取链接的方法

element=bro.find_element_by_xpath('//[@id="J_goodsList"]/ul/li[1]/div/div[3]/a[@href]')print(element.get_attribute('href'))

2021-09-22 12:20:12 1673

原创重新安装python

cd进入python位置:先安装 pinpython -m ensurepip更新 pinpython -m pip install --upgrade pip

2021-09-13 23:32:32 278

转载 python遍历txt文件的 5种方法

#方法一：直接遍历法,按行读取,每行返回一个字符串类型f1= open("C:/Users/Administrator/Desktop/qj_ly_product_list.txt",'r',encoding= 'UTF-8')for i in f1: print(i,end = '')#方法二：:read法，如果指定了参数 size，就按照该指定长度从文件中读取内容.否则，可以一次读取文件的全部内容，Python把内容读到内存，用一个str对象表示,被读出来的内容，全部塞到一个字符串里面..

2021-09-13 11:47:55 10707 1

转载 selenium: xpath 选择元素

绝对路径: /elements = driver.find_elements_by_xpath("/html/body/div")css表达式html>body>div相对路径: //elements = driver.find_elements_by_xpath("//div//p")如果使用CSS选择器，则为divp通配符: /如果要选择所有div节点的所有直接子节点，可以使用表达式//div/**是一个通配符，对应任意节点名的元素，等价于...

2021-09-06 18:18:46 450

转载 selenium: 鼠标右键点击、双击、移动鼠标到某个元素、鼠标拖拽

通过 Selenium 提供的ActionChains类来实现from selenium import webdriverdriver = webdriver.Chrome(r'f:\chromedriver.exe')driver.implicitly_wait(5)driver.get('https://www.baidu.com/')from selenium.webdriver.common.action_chains import ActionChainsac ..

2021-09-06 14:16:08 3271

转载 selenium 窗口切换

切换到frame使用 WebDriver 对象的 switch_to 属性, frame_reference 可以是 frame 元素的属性 name 或者 IDwd.switch_to.frame(frame_reference)比如这里，就可以填写 iframe元素的id ‘frame1’ wd.switch_to.frame('frame1')或者 name属性值 ‘innerFrame’wd.switch_to.frame('innerFrame')也可以填写fr..

2021-09-06 13:35:52 533

转载 selenium 中 css-寻找元素

等同于 tag名,不改变.elements = wd.find_elements_by_css_selector('div')elements = wd.find_elements_by_tag_name('div')id值, 加上#: #id值element = wd.find_element_by_css_selector('#searchtext')element.send_keys('你好')class值, 加上. : . class值elements = ...

2021-09-06 11:41:38 690

转载 selenium 中普通-寻找元素

# 导入Select类from selenium.webdriver.support.ui import Select# 创建Select对象select = Select(wd.find_element_by_id("ss_single"))# 通过 Select 对象选中select.select_by_visible_text("老师")...

2021-09-06 10:21:50 159

原创 selenium 中页面刷新-等待

加入:wd.implicitly_wait(10)

2021-09-06 10:12:06 527

原创 json格式转成表格格式

import jsonimport pandas as pddf=pd.read_json('./公告遴选苏州.json',lines=True,encoding='utf-8')# print(df.columns)cols=list（df.columns)# 先删除,然后移动,标题交换cols.insert(0,cols.pop(cols.index('招标人')))# 内容交换,通过索引赋值df=df.loc[:,cols]# 创建一个表格df.to_excel('./wang.

2021-08-24 11:39:13 1486

原创保存文件到本地

1.文字保存成文档h_list=etree.HTML(page_text)div_list=h_list.xpath('//section[@class="list"]/div')fp=open('5.txt','w',encoding='utf-8')for div in div_list: title=div.xpath('./a/div[2]/div/div/h3/text()')[0] fp.write(title+'\n')2. 图片保存到文件夹# 如果不存在.

2021-08-24 11:37:46 125

原创 scrapy 图片下载不了到本地

显示错误: DEBUG: Crawled (301)处理:在setting中加上: MEDIA_ALLOW_REDIRECTS = True

2021-08-23 21:21:25 311

原创清除终端 Terminal 的代码快捷键(清屏)

直接输入 Ctrl+L

2021-08-17 12:00:01 2467 1

原创 selenium: 网页打开最大化

# 打开网页最大化bro = webdriver.Chrome()bro.maximize_window()

2021-08-15 20:53:50 670

原创 selenium: 全屏往下拉

for i in range(100): js = 'window.scrollTo(0,%s)'%(i*100) bro.execute_script(js) sleep(0.5)

2021-08-13 10:49:53 86

原创 Python数据输出为表格的形式

1、安装： pip install mysqlclient2、pandas

2021-08-04 14:22:43 2485

原创 xpath 空文档

1、检查xpath中是否有tbody如：//*[@id="main"]/div[2]/table/tbody/tr[2]/td/table/tbody/tr[3]/td[2]有tbody，只需要将 tbody 删掉即可。

2021-08-04 14:11:06 171

原创文本乱码的情况

方法一：response=requests.get(url=url,headers=headers)response.encoding='utf-8'page_text=response.text方法二：只需要针对乱码的属性值处理就行。img_name=li.xpath('./a/img/@alt')[0]+'.jpg'img_name=img_name.encode('iso-8859-1').decode('gbk')...

2021-08-04 11:31:48 168

翻译 Python 快捷键

编辑（Editing）Ctrl + Space 基本的代码完成（类、方法、属性）Ctrl + Alt + Space 快速导入任意类Ctrl + Shift + Enter 语句完成Ctrl + P 参数信息（在方法中调用参数）Ctrl + Q 快速查看文档Shift + F1 外部文档Ctrl + 鼠标简介Ctrl + F1 显示错误描述或警告信息Alt + Insert 自动生成代码Ctrl + O 重新方法Ctrl + Alt + T 选中Ctrl + / 行注释Ctrl + Shift + / 块

2021-07-27 14:09:25 138

joy_oc的博客