目录
split()截取一部分的字符串
str = 'https://www.baidu.com/pdf/abcdefg.pdf'
# 输出字符串,>>>https://www.baidu.com/pdf/abcdefg.pdf
print(str)
# 做为一个整体截取,>>>['https://www.baidu.com/pdf/abcdefg.pdf']
print(str.split())
# 把字符串分割,>>>['https:', '', 'www.baidu.com', 'pdf', 'abcdefg.pdf']
print(str.split('/'))
# 输出第一段字符串,>>>https:
print(str.split('/')[0])
# 输出最后一段字符串,>>>abcdefg.pdf
print(str.split('/')[-1])
# 把最后一段字符串再次分割,>>>['abcdefg', 'pdf']
print(str.split('/')[-1].split('.'))
# 输出>>>abcdef
print(str.split('/')[-1].split('.')[0])
#python中的split方法只能通过指定的某一个字符分割字符串,因此要实现实现多符号分割的话,就要调用#re模块中的split()函数
import re
words = 'a b c.d?e!f'
>>>re.split(' |!|\?|\.', words)
['a', 'b', 'c', 'd', 'e', 'f']
读取文件夹下的所有Excel
# 结果文件
result = pd.ExcelWriter(SETUP_DIR+r'\xlsx\高频数据.xls')
# 获取表格列表
origin_file_list = os.listdir(r'H:\HighBroAlarm\xlsx')
print(origin_file_list)
# 循环遍历表格
for i in origin_file_list:
#获取文件夹下的文件名
print(i)
excel_file_name = i
#拼接每个文件的路径
file_path =r'H:\HighBroAlarm\xlsx\%s' % i
print(file_path)
# 读取文件内容
# 跳过0行
content = pd.read_excel(file_path, skiprows=[0])
# 有缺陷,会扩展列名
# content = pd.read_excel(file_path)
# 重新定义sheet名字
sheet_name = i[:len(i) - 4]
# 转换为同一个表多个sheet
content.to_excel(result, sheet_name, index=False)
# content.to_excel()
result.save()
模糊匹配符合条件的Excel
# 结果文件
result = pd.ExcelWriter(SETUP_DIR+r'\xlsx\高频数据.xls')
##固定路径下的模糊匹配
for name in glob.glob(r'H:\HighBroAlarm\xlsx\*20191230.xlsx'):
print (name)
##相对路径下的模糊匹配
for name in glob.glob(SETUP_DIR+r'\xlsx\*20191230.xlsx'):
#路径名
print (name)
#模糊匹配到的文件名
excel_file_name = str(name).split('\\')[-1]
print(excel_file_name)
#拼接每个文件的路径
file_path =SETUP_DIR+r'\xlsx\%s' % excel_file_name
print(file_path)
# 读取文件内容
# 跳过0行
content = pd.read_excel(file_path, skiprows=[0])
# 重新定义sheet名字
sheet_name = excel_file_name[:len(excel_file_name) - 4]
# 转换为同一个表多个sheet
content.to_excel(result, sheet_name, index=False)
# content.to_excel()
result.save()