解决python遇到Unicode字符无法输出到ANSI编码文本的小技巧

#coding:gbk
from selenium import webdriver
from selenium.webdriver.common import options
from selenium.webdriver.support.select import Select
from selenium.webdriver.common.by import By 
import time

options = webdriver.ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-logging'])
driver = webdriver.Chrome(executable_path ="chromedriver",options=options)
driver.get("https://liquicity.com/artists/")
time.sleep(1)
num=-1
while True:
    try:
        num+=1
        artists=driver.find_elements(By.CLASS_NAME,'elementor-button-text')[num].text
        print(artists)
        with open("liquicity_artists.txt","a") as f:
            if num == 22 :
                f.write("Ella Noel\n")
            else:
                f.write(artists+"\n")
    except:
        break

先看看是哪一行有Unicode字符,发现是第22行。那么写一个if判断到22行时就输出修改过的字母追加到文本就行。
在这里插入图片描述

with open("liquicity_artists.txt","a") as f:
        if num == 22 :
            f.write("Ella Noel\n")
        else:
            f.write(artists+"\n")

这里的open用的a参数,这样就可以追加文本,而不是替换文本之前的内容。

结果正常导出到txt,编码也是ANSI码。
在这里插入图片描述不过这种方法适合于我这种爬取数据少的情况下,其实更简单直接复制控制台里面的输出的内容过去到文本里面改也可以。

参考文献:
python selenium while 循环

【python】读取和输出到txt

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值