日常python 助一臂之力

xlsx转csv

import pandas as pd

def xlsx_to_csv_pd(filename):
    data_xls = pd.read_excel(filename, index_col=0)
    csv_filename = filename[:-5] + '.csv' # csv文件全名
    data_xls.to_csv(csv_filename, encoding='utf-8')
 
 
if __name__ == '__main__':
    filename = "xxxxxxxx.xlsx" # xlsx文件全名
    xlsx_to_csv_pd(filename)

xlsx写入txt

import pandas as pd

sheet_name_list = ["2月28日","3月1日", "3月2日"]
        
with open("title.txt", "w", encoding="utf-8") as f:
    for i in range(len(sheet_name_list)):
        # 打开xlsx文件读取数据,指定sheet
        data = pd.read_excel('./2月25日至3月4日模板.xlsx', 
                             sheet_name=sheet_name_list[i])
        for index, row in data.iterrows():
            title = row["标题"]
            f.write(title+"\n")

合并文件夹内的所有xlsx文件

from tqdm import tqdm
import os
import pandas as pd
 
def get_data(path):
    df_list = []
    for file in tqdm(os.listdir(path)):
        file_path = os.path.join(path, file)
        df = pd.read_csv(file_path, engine='python', encoding='utf-8')
        df_list.append(df)
    df = pd.concat(df_list)
    return df

TEST_PATH = 'xxx/xxx/xxxxx'
test_df = get_data(TEST_PATH)
test_df.to_csv(path_or_buf="test.csv", index=False)

list中所有元素串成一个字符串

list_str = ['我','爱', '学习']
s = ''.join(list_str)
pritn(s)

list中的元素都变成字符串

list_num = [2, 3, 4]]
list_str = [str(i) for i in list_num]

beautifulsoup获取网页正文

import requests
from bs4 import BeautifulSoup
newsurl = "https://baijiahao.baidu.com/s?id=1692067102120399651&wfr=spider&for=pc"
res = requests.get(newsurl)
res.encoding = 'utf-8'
#print(res.text)

soup = BeautifulSoup(res.text, 'html.parser')
article = []
for p in soup.select('.bjh-p')[:-1]:
    article.append(p.text.strip())
print(article)

''.join(article)

参考链接:python爬虫——获取正文内容

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值