【办公类-22-10】周计划系列(5-2)“周计划-02源文件docx读取5天“ (2024年调整版本)

背景需求

承接上文,继续制作周计划

【办公类-22-09】周计划系列(5-1)“周计划-01源文件统一名称“ (2024年调整版本)-CSDN博客文章浏览阅读76次。【办公类-22-09】周计划系列(5-1)“周计划-01源文件统一名称“ (2024年调整版本)https://blog.csdn.net/reasonsummer/article/details/136307443

 去年做过周计划的提取——用的是旧模板(部分框架内容有缺失)【办公类-22-04】周计划系列(4)-生成“周计划”(提取旧docx指定段落的内容,写入EXCLE模板,再次生成新docx)_用python做周计划-CSDN博客文章浏览阅读498次。【办公类-22-04】周计划系列(4)-生成“周计划”(提取旧docx指定段落的内容,写入EXCLE模板,再次生成新docx)_用python做周计划https://blog.csdn.net/reasonsummer/article/details/130451332经过1年的循环,本次用的是更新过的模板及内容(所有框架内容都有)——新模板

素材准备:

word读取内容

第1页

第2-4页

第5页(反思)

提取的内容很多很多很多……到现在我也不确定代码提取的内容和占位格是否”全”了o(╥﹏╥)o,不断调试吧。

代码展示:

from docx import Document

import os,time

from openpyxl import load_workbook
import glob
import re
import xlrd

pathall=[]
path =r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\03去掉回车'
 
for file_name in os.listdir(path):
    print(path+'\\'+file_name)
    pathall.append(path+'\\'+file_name)
print(pathall)
print(len(pathall))# 19

# 新建EXCEL
import xlwt 
f = xlwt.Workbook('encoding = utf-8')#设置工作簿编码
sheet1 = f.add_sheet('sheet1',cell_overwrite_ok=True)#创建sheet工作表

n=1

for h in range(len(pathall)):    # 19份19行
    LIST=[]
    path=pathall[h]

    doc = Document(path)
    
    # 获取第一行段落文字
    bt=doc.paragraphs[0].text
    # print(bt)
    # 中(5)班  第三周  活动安排
    LIST.append(bt[0])    # 添加年级
    LIST.append(bt[2])    # 添加班号
    LIST.append(bt[7:-6])    # 添加周次 大写
    # 获取第一行段落文字
    rq1=doc.paragraphs[1].text
    LIST.append(rq1[3:])    # 添加起止日期 
# print(LIST)




    # 获取所有表格对象
    tables = doc.tables
    # 获取word中第一个表格(周计划表)
    table = tables[0]


#     # print('-----提取第1张表格(周计划表)里面的内容----------')
    # 星期X 
    for xq in range(3,8):
        xq1 = table.cell(0,xq).text        # K.append(k)        
        LIST.append(xq1)
    
#     
    # 生活名称
    l = table.cell(1,4).text
    # print(l)
    # 吃点心
    LIST.append(l)
    # 生活说明(1格2行,分开) (导入做参考,实际是自己写)
    ll=table.cell(2,4).text.split('\n')
    # print(ll)
#    ['1.观察值日生在自主午餐环节中帮助阿姨分碗筷、毛巾的情况。', '2.提醒幼儿在自主午餐的过程中不说话,打喷嚏咳嗽要对外。']
    # 不要“1、”、“2、”
    L=[]
    for lll in range(2):    # 一共2条
        L.append(ll[lll][2:])      #    # 不要“1、”、“2、”
        LIST.append(ll[lll][2:])   
    # print(L)
    
#     # ['观察幼儿在吃点心时是否能熟练地使用夹子夹取饼干。', '提醒个别幼儿喝完牛奶擦嘴巴。']

    # 运动=集体游戏+分散游戏 导入,做参考,需要调整
     # 集体游戏 
    for jt in range(3,8):
        jt1 = table.cell(3,jt).text        # K.append(k)        
        LIST.append(jt1)
    
     # 集体游戏 
    for jt2 in range(3,8):
        jt3 = table.cell(4,jt2).text        # K.append(k)        
        LIST.append(jt3)


    # 运动观察与指导(导入做参考,实际是自己写)
    s=table.cell(5,4).text.split('\n')
    # print(s)
#     # [1.'观察幼儿是否能双手握住曲棍杆将皮球打出一定距离。', '2.观察幼儿是否能寻找皮球的多种玩法。', '3.提醒幼儿注意打曲棍干的安全。']
#     # 有些序号是自动编号,不占字数。
    S=[]
    for sss in range(3):    # 一共3条
        S.append(s[sss][2:])         # 不要“1、”、“2、”、“3、”
        LIST.append(s[sss][2:])
    # print(S)
#     # ['幼儿是否能双手握住曲棍杆将皮球打出一定距离。', '幼儿是否能寻找皮球的多种玩法。', '提醒幼儿注意打曲棍干的安全。']

    # 游戏内容 角色游戏 导入做参考,每年都在更换 
    for fj in range(3,8):
        fj2 = table.cell(7,fj).text                
        LIST.append(fj2)

    # 游戏观察与指导(导入做参考,实际是自己写)
    g=table.cell(8,4).text.split('\n')
    # print(g)
    # ['1、观察娃娃家的幼儿是否会照顾娃娃,与娃娃互动。', '2、重点观察医生在小医院游戏中,与病人的互动时能否加上一些肢体动作。', '3、观察幼儿角色游戏结束后,能否帮助其他伙伴一同整理材料。']
    # 有些序号是自动编号,不占字数。
    G=[]
    for ggg in range(2):    # 一共3条
        G.append(g[ggg][2:])         # 不要“1、”、“2、”、“3、”
        LIST.append(g[ggg][2:]) 
    # print(G)
#     # ['观察娃娃家的幼儿是否会照顾娃娃,与娃娃互动。', '重点观察医生在小医院游戏中,与病人的互动时能否加上一些肢体动作。', '观察幼儿角色游戏结束后,能否帮助其他伙伴一同整理材料。']

    # 主题和主题说明
    ti=table.cell(9,4).text.split('\n')
#     print(ti)

    # ['春天来了', '1、了解春天是个万物生长的季节,关注自然环境的不断变化。', '2、感受大自然美丽的景像,以各种方式表达自己的情感与体验。']
    # 有些序号是自动编号,不占字数。
    T=[]# 第1个春天来了,不需要删除序号,直接添加
    T.append(ti[0])
    LIST.append(ti[0])
    for ttt in range(1,3):    # 一共2条主题说明
        T.append(ti[ttt][2:])         # 不要“1、”、“2、”、
        LIST.append(ti[ttt][2:])
    # print(T)
    # ['春天来了', '了解春天是个万物生长的季节,关注自然环境的不断变化。', '感受大自然美丽的景像,以各种方式表达自己的情感与体验。']

    # 个别化内容(3-5项) 一行多个,全部写入
    iiii=table.cell(10,4).text.split('\n')
    # print(iiii)
    for xx in iiii:    
        LIST.append(xx)
    #  ['电风扇转起来了、漂亮的帽子、绿太阳、大雨小雨、做柳树等']
    

    # 个别化观察与指导(导入做参考,实际是自己写)
    ii=table.cell(12,4).text.split('\n')
    # print(ii)  
    # # ['1.观察幼儿组装各种小电风扇的情况,鼓励幼儿不断进行尝试。', '2.观察幼儿制作帽子的情况,提示幼儿尝试不同的材料进行装饰。', '3.观察幼儿在活动过程中的专注程度,鼓励幼儿专心做自己的事。'] 
    # # # 有些序号是自动编号,不占字数。
    I=[]
    for iii1 in range(3):    # 一共3条
        I.append(ii[iii1][2:])         # 不要“1、”、“2、”、“3、”
        LIST.append(ii[iii1][2:])
    # print(I)
    # # ['观察幼儿是否能通过协商分配角色表演故事《三只蝴蝶》。', '观察幼儿是否能看懂图谱,跟着音乐打节奏。']
   
    
    # 集体学习 横向五个格子
    K =[]
    for e in range(3,8):
        k = table.cell(13,e).text
        K.append(k)        
        LIST.append(k)
    # print(K)
    # # ['空中小屋\n(偏语言领域)', '花园里有什么\n(偏科学领域-探究)', '*猴子看猴子做\n(偏艺术领域-音乐)', '*借形想象\n(偏艺术领域-美术)', 'PATHS课程--赞美1(偏社会领域)']

    
    # 家园共育(导入做参考,实际是自己写)    
    yy=table.cell(14,4).text.split('\n')
    # print(yy)
    # ['1、为春游活动做准备。', '2、在家长的帮助下学习折一些纸花。', '3、天气转暖,适当地为孩子减少衣服。']
    # 有些序号是自动编号,不占字数。删除2字符后,可能会少前面几个字
    Y=[]
    for yyy in range(2):    # 一共3条
        Y.append(yy[yyy][2:])         # 不要“1、”、“2、”、“3、”
        LIST.append(yy[yyy][2:])
    # print(Y)
    # ['为春游活动做准备。', '在家长的帮助下学习折一些纸花。', '天气转暖,适当地为孩子减少衣服。']
    

    # # 反馈与调整(变化很大)不导入
    ff=table.cell(1,8).text.split('\n')
    # print(ff)
    # print(h+1,len(ff))
    # # 8行
    
    
    for j in range(2):
        # 提取活动1
        LIST.append(ff[j*4][0:4])    
        # # 提取身份1
        LIST.append(ff[j*4][10:-1])
        # 提取反思1
        LIST.append(ff[j*4+1])
        # print(LIST)
    #     # # 提取调整1
        LIST.append(ff[j*4+3])
    # print(LIST)

    
    print('-----提取第2-5张表格(教案)里面的内容----------')
    # 第1周、第20周,或国庆周会出现格子表格不满的情况,需要手动调整

    # 第2、3页教案上的日期
        # 由于不能确定段落
        # 所以直接list 3空格(小日期、周次、班级
    # for er in range(3):
    tk1='2023年2月27日—2023年2月28日'
    tk2='周次1、2、3'
    tk3='中4'
    LIST.append(tk1)
    LIST.append(tk2)
    LIST.append(tk3)

    for a in range(1,3): # 先提取2张表(  共有3张表,其中第1、2张表提取00和01,第3表提取00)
        
        
        
        for b in range(2):        # 表1有两个格子00 01 表2有两个格子00 01
            
            table = tables[a]        # 表1 表2 

            # 有两张表
            all=table.cell(0,b).text.split('\n')
            print(len(all))
            # 看看表格里面的行数,如果等于1行(元宵节放假),就写6个空格
            if len(all)==1:
                for tt in range(6):
                    LIST.append('')
            else:

                # print(all)

                # 提取活动名称(删除后面的执教人员)
                title=all[0][5:][:-6]
                LIST.append(title)
                
                # print(title)
                # 空中小屋等4个题目

                # 提取活动目标(2行)删除前面的序号
                topic=[]
                for to in range(2,4):    # 行数
                    mb=all[to][2:]
                    LIST.append(mb)

                    # topic.append(all[to][2:])
                    
                # print(topic)
                # ['理解故事,知道春天是竹笋快速生长的季节。', '乐意想办法帮助小狐狸解决问题,并能大胆表达自己的想法。']

                # 提取活动准备
                # (第一种:经验准备)
                pre1=all[5][5:]
                LIST.append(pre1)
                # print(pre)
                # (第二种:材料准备)
                pre2=all[6][5:]
                LIST.append(pre2)
                # print(pre2)

                # ppt、故事录音

                # 提取活动过程
                pro=all[8:]
                PRO='\n'.join(pro)
                # print(PRO)
                LIST.append(PRO)
                # 一、我家住几楼---导入主题,激起幼儿兴趣
                # 1、你们的家住在哪里?住在几楼?为什么买这么高?
                # 小结:是呀,住这么高的房子可以看到远远的风景。
                # 2、小狐狸也想住楼房,楼上的房间高高的,远远望去,可以看见一片美景,那该多开心。
                # 二、房子造在哪?---分段欣赏

    for a in range(3,4): # 最后提取第3张表的00部分
        for b in range(1):        # 表1有两个格子00 01 表2有两个格子00 01
            
            table = tables[a]        # 表1 表2 
            # 有两张表
            all=table.cell(0,b).text.split('\n')
            if len(all)==1:
                LIST.append('')

            # print(all)
            else:
                # 提取活动名称(删除后面的执教人员)
                title=all[0][5:][:-6]
                LIST.append(title)
                # print(title)
                # 空中小屋 只有一个标题

                # 提取活动目标(2行)删除前面的序号
                topic=[]
                for t in range(2,4):    # 行数
                    topic.append(all[t][2:])
                    LIST.append(all[t][2:])
                # print(topic)
                # ['理解故事,知道春天是竹笋快速生长的季节。', '乐意想办法帮助小狐狸解决问题,并能大胆表达自己的想法。']

                # 提取活动准备
                # (第一种:经验准备)
                pre1=all[5][5:]
                LIST.append(pre1)
                # print(pre)
                # (第二种:材料准备)
                pre2=all[6][5:]
                LIST.append(pre2)
                # print(pre2)

                # 提取活动过程
                pro=all[8:]
                # print(pro)
                # # 这是列表样式
                # ['一、我家住几楼---导入主题,激起幼儿兴趣', '1、你们的家住在哪里?住在几楼?为什么买这么高?', '小结:是呀,住这么高的房子可以看到远远的风景。', '2、小狐狸也想住楼房,楼上的房间高高的,远远望去 
                # ,可以看见一片美景,那该多开心。', '二、房
                # 合并列表
                PRO='\n'.join(pro)
                # print(PRO)
                LIST.append(PRO)
                # 一、我家住几楼---导入主题,激起幼儿兴趣
                # 1、你们的家住在哪里?住在几楼?为什么买这么高?
                # 小结:是呀,住这么高的房子可以看到远远的风景。
                # 2、小狐狸也想住楼房,楼上的房间高高的,远远望去,可以看见一片美景,那该多开心。
                # 二、房子造在哪?---分段欣赏


    for c in range(2):        # 表3的01有两个上下格子  表2有两个格子00 01
        
        table = tables[3]        # 表3
        # 有两张表
        fs=table.cell(c,1).text.split('\n')
        # print(fs)
        # 提取反思的课程名字
        # 提取活动名称(删除后面的执教人员)
        fstitle=fs[1][5:][:-6]
        # print(fstitle)
        LIST.append(fstitle)
    
        # 纯反思部分(第三行开始)    
        fs1=fs[2:]
        # print(fs1)
        fs3=[]
        for i in range(len(fs1)):
            fs4='         '+fs1[i]        # 主动添加缩进2字符
            # print(fs4)
            fs3.append(fs4)

        # 合并列表
        fs2='\n'.join(fs3)
        # print(fs2)
        LIST.append(fs2)
        


        

# print(LIST)   


    for g in range(len(LIST)):
        # K =[1,3,4,6,8,10]#要写入的列表的值
        sheet1.write(n,g,LIST[g])#写入数据参数对应 行,列,值

    n+=1
f.save(r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\09 原计划提取的内容.xls')#保存.x1s到当前工作目录




# doc.close(path)

time.sleep(5)


print('--打开XLSX-,把里面的空格删除,把1、替换成1.--')# 



# # 关闭Excel文件
# workbook.close()
import xlrd
import xlwt

# 打开Excel文件
workbook = xlrd.open_workbook(r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\09 原计划提取的内容.xls')
worksheet = workbook.sheet_by_index(0)  # 选择要读取的工作表

# 创建一个新的Workbook对象
new_workbook = xlwt.Workbook()
new_worksheet = new_workbook.add_sheet('Sheet1')  # 新建一个工作表

# 遍历每一行
for row_index in range(worksheet.nrows):
    row_values = worksheet.row_values(row_index)
    for col_index, cell_value in enumerate(row_values):
        if isinstance(cell_value, str):
            # 清除单元格内文字的格式
            cell_value = cell_value.strip()

            # 替换文本
            for s in range(1, 10):
                cell_value = cell_value.replace("{}、".format(s), "{}.".format(s))

            cell_value = cell_value.replace("执教:", "")
            cell_value = cell_value.replace("执教", "")
            cell_value = cell_value.replace("XX", "")#源文件上的教师名字
            cell_value = cell_value.replace("XXX", "") #源文件上的教师名字
            cell_value = cell_value.replace(' ', '')
            cell_value = cell_value.replace(' ', '')
            cell_value = cell_value.replace( "  ", '')
           

            # # 判断单元格中的文字是否有空格
            # if ' ' in cell_value:
            #     # 替换空格为无空格
            #     cell_value = cell_value.replace(' ', '')

            # if ' ' in cell_value:
            #     # 替换空格为无空格
            #     cell_value = cell_value.replace(' ', '')

            # 替换文本
            for s in range(1, 10):
                cell_value = cell_value.replace("{}、".format(s), "{}.".format(s))

        # 将修改后的值写入新的Workbook中
        new_worksheet.write(row_index, col_index, cell_value)

# 保存修改后的Excel文件
new_workbook.save(r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\09 原计划提取的内容(仅导出部分).xls')

重点:

一、读取word表格中的每个单元格的坐标,在提取里面的数据

因为这里有合并,(1,4)坐标与(1,3)(1,5、1、6 、1、7)都显示“我是小小值日生”这个内容

二、遇到节日“无教案”,读不到相关数据,程序会出现报错。

处理方法:先判断表格里面的文字有几段?如果等于1段,就直接写入6个空格(占位用),如果大于1段,说明里面有教案,就分别提取每段的内容

三、EXCEL,能看到的需要删除的内容,都用程序去删掉(不要手动删除)

最后结果:

因为遇到一周6-8次的模板,程序会报错(某些格子内容会读不到,就报错)

本篇都是一周5次的教案,少了两次的内容,

后续思考,

1、如何批量读取6-8次内容的教案,写在一个EXCEL里?感觉为了2个特殊周,把EXCEL表格做很长,不值得

2、把6-8次一周的教案改成1周5次的(删除某列格子,多出来的2天或1天也做成同样的5次,部分内容空白、)这样便于提取。

3、确定每学期把教案想办法都做成5天一周,绝对不要拆分列。

把7天的第一周拆成2份

现在都是5天版本的

重新生成一次

把所有的一周五天的周计划的内容提取到excel

代码展示

from docx import Document

import os,time

from openpyxl import load_workbook
import glob
import re
import xlrd

pathall=[]
path =r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\03去掉回车'
 
for file_name in os.listdir(path):
    print(path+'\\'+file_name)
    pathall.append(path+'\\'+file_name)
print(pathall)
print(len(pathall))# 19

# 新建EXCEL
import xlwt 
f = xlwt.Workbook('encoding = utf-8')#设置工作簿编码
sheet1 = f.add_sheet('sheet1',cell_overwrite_ok=True)#创建sheet工作表

# 写入标题

titleall=['grade', 'classnum', 'weekhan', 'datelong', 'day1', 'day2', 'day3', 'day4', 'day5', 'life', 'life1', 'life2',\
     'sportcon1', 'sportcon2', 'sportcon3', 'sportcon4', 'sportcon5', 'sport1', 'sport2', 'sport3', 'sport4', 'sport5',\
         'sportzd1', 'sportzd2', 'sportzd3', 'game1', 'game2', 'game3', 'game4', 'game5', 'gamezd1', 'gamezd2', \
            'theme', 'theme1', 'theme2', 'gbstudy', 'art', 'gbstudy1', 'gbstudy2', 'gbstudy3', 'jtstudy1', 'jtstudy2', 'jtstudy3', 'jtstudy4', 'jtstudy5', \
                'gy1', 'gy2', 'fk1', 'pj11', 'fk1nr', 'fk1tz', 'fk2', 'pj21', 'fk2nr', 'fk2tz', 'dateshort', 'weekshu', \
                    'title1', 'topic11', 'topic12', 'jy1', 'cl1', 'j1gc', \
                        'title2', 'topic21', 'topic22', 'jy2', 'cl2', 'j2gc', \
                            'title3', 'topic31', 'topic32', 'jy3', 'cl3', 'j3gc', \
                                'title4', 'topic41', 'topic42',  'jy4','cl4', 'j4gc',\
                                     'title5', 'topic51', 'topic52', 'jy5', 'cl5', 'j5gc',\
                                         'fs1', 'fs11', 'fs2', 'fs21','T1','T2','T3','T4','T5']
for l9 in range(len(titleall)):
    sheet1.write(0,l9,titleall[l9])

n=1

for h in range(len(pathall)):    # 19份19行
    LIST=[]
    path=pathall[h]

    doc = Document(path)
    
    # 获取第一行段落文字
    bt=doc.paragraphs[0].text
    
    # print(bt)
    # 中(5)班  第三周  活动安排
    LIST.append(bt[0])    # 添加年级
    LIST.append(bt[2])    # 添加班号
    if len(bt)==16:
        LIST.append(bt[8:9])    # 添加周次 大写 如果长度等于15 就是一位数汉字
    else:
        LIST.append(bt[8:10])

    # 获取第一行段落文字
    rq1=doc.paragraphs[1].text
    LIST.append(rq1[3:])    # 添加起止日期 
# print(LIST)

# ll=['grade','classnum','weekhan','datelong'.]



    # 获取所有表格对象
    tables = doc.tables
    # 获取word中第一个表格(周计划表)
    table = tables[0]


#     # print('-----提取第1张表格(周计划表)里面的内容----------')
    # 星期X
    for xq in range(3,8):
        xq1 = table.cell(0,xq).text        # K.append(k)        
        LIST.append(xq1)

    # 提取阿拉伯数字的周    
    # LIST.append(h+1)

#     
    # 生活名称
    l = table.cell(1,3).text
    # print(l)
    # 吃点心
    LIST.append(l)

    # 生活说明(1格2行,分开) (导入做参考,实际是自己写)
    ll=table.cell(2,3).text.split('\n')
    # print(ll)
#    ['1.观察值日生在自主午餐环节中帮助阿姨分碗筷、毛巾的情况。', '2.提醒幼儿在自主午餐的过程中不说话,打喷嚏咳嗽要对外。']
    # 不要“1、”、“2、”
    L=[]
    for lll in range(2):    # 一共2条
        L.append(ll[lll][2:])      #    # 不要“1、”、“2、”
        LIST.append(ll[lll][2:])   
    # print(L)
    
#     # ['观察幼儿在吃点心时是否能熟练地使用夹子夹取饼干。', '提醒个别幼儿喝完牛奶擦嘴巴。']

    # 运动=集体游戏+分散游戏 导入,做参考,需要调整
     # 集体游戏 
    for jt in range(3,8):
        jt1 = table.cell(3,jt).text        # K.append(k)        
        LIST.append(jt1)
    
     # 集体游戏 
    for jt2 in range(3,8):
        jt3 = table.cell(4,jt2).text        # K.append(k)        
        LIST.append(jt3)


    # 运动观察与指导(导入做参考,实际是自己写)
    s=table.cell(5,4).text.split('\n')
    # print(s)
#     # [1.'观察幼儿是否能双手握住曲棍杆将皮球打出一定距离。', '2.观察幼儿是否能寻找皮球的多种玩法。', '3.提醒幼儿注意打曲棍干的安全。']
#     # 有些序号是自动编号,不占字数。
    S=[]
    for sss in range(3):    # 一共3条
        S.append(s[sss][2:])         # 不要“1、”、“2、”、“3、”
        LIST.append(s[sss][2:])
    # print(S)
#     # ['幼儿是否能双手握住曲棍杆将皮球打出一定距离。', '幼儿是否能寻找皮球的多种玩法。', '提醒幼儿注意打曲棍干的安全。']

    # 游戏内容 角色游戏 导入做参考,每年都在更换 
    for fj in range(3,8):
        fj2 = table.cell(7,fj).text                
        LIST.append(fj2)

    # 游戏观察与指导(导入做参考,实际是自己写)
    g=table.cell(8,4).text.split('\n')
    # print(g)
    # ['1、观察娃娃家的幼儿是否会照顾娃娃,与娃娃互动。', '2、重点观察医生在小医院游戏中,与病人的互动时能否加上一些肢体动作。', '3、观察幼儿角色游戏结束后,能否帮助其他伙伴一同整理材料。']
    # 有些序号是自动编号,不占字数。
    G=[]
    for ggg in range(2):    # 一共3条
        G.append(g[ggg][2:])         # 不要“1、”、“2、”、“3、”
        LIST.append(g[ggg][2:]) 
    # print(G)
#     # ['观察娃娃家的幼儿是否会照顾娃娃,与娃娃互动。', '重点观察医生在小医院游戏中,与病人的互动时能否加上一些肢体动作。', '观察幼儿角色游戏结束后,能否帮助其他伙伴一同整理材料。']

    # 主题和主题说明
    ti=table.cell(9,4).text.split('\n')
#     print(ti)

    # ['春天来了', '1、了解春天是个万物生长的季节,关注自然环境的不断变化。', '2、感受大自然美丽的景像,以各种方式表达自己的情感与体验。']
    # 有些序号是自动编号,不占字数。
    T=[]# 第1个春天来了,不需要删除序号,直接添加
    T.append(ti[0])
    LIST.append(ti[0])
    for ttt in range(1,3):    # 一共2条主题说明
        T.append(ti[ttt][2:])         # 不要“1、”、“2、”、
        LIST.append(ti[ttt][2:])
    # print(T)
    # ['春天来了', '了解春天是个万物生长的季节,关注自然环境的不断变化。', '感受大自然美丽的景像,以各种方式表达自己的情感与体验。']

    # 个别化内容(3-5项) 一行多个,全部写入
    iiii=table.cell(10,4).text.split('\n')
    # print(iiii)     
    LIST.append(iiii)
    #  ['电风扇转起来了、漂亮的帽子、绿太阳、大雨小雨、做柳树等']

    # 美术专用活动室
    ii8=table.cell(11,4).text.split('\n')
    # print(iiii)     
    LIST.append(ii8)
    

    # 个别化观察与指导(导入做参考,实际是自己写)
    ii=table.cell(12,4).text.split('\n')
    # print(ii)  
    # # ['1.观察幼儿组装各种小电风扇的情况,鼓励幼儿不断进行尝试。', '2.观察幼儿制作帽子的情况,提示幼儿尝试不同的材料进行装饰。', '3.观察幼儿在活动过程中的专注程度,鼓励幼儿专心做自己的事。'] 
    # # # 有些序号是自动编号,不占字数。
    I=[]
    for iii1 in range(3):    # 一共3条
        I.append(ii[iii1][2:])         # 不要“1、”、“2、”、“3、”
        LIST.append(ii[iii1][2:])
    # print(I)
    # # ['观察幼儿是否能通过协商分配角色表演故事《三只蝴蝶》。', '观察幼儿是否能看懂图谱,跟着音乐打节奏。']
   
    
    # 集体学习 横向五个格子
    K =[]
    for e in range(3,8):
        k = table.cell(13,e).text
        K.append(k)        
        LIST.append(k)
    # print(K)
    # # ['空中小屋\n(偏语言领域)', '花园里有什么\n(偏科学领域-探究)', '*猴子看猴子做\n(偏艺术领域-音乐)', '*借形想象\n(偏艺术领域-美术)', 'PATHS课程--赞美1(偏社会领域)']

    
    # 家园共育(导入做参考,实际是自己写)    
    yy=table.cell(14,4).text.split('\n')
    # print(yy)
    # ['1、为春游活动做准备。', '2、在家长的帮助下学习折一些纸花。', '3、天气转暖,适当地为孩子减少衣服。']
    # 有些序号是自动编号,不占字数。删除2字符后,可能会少前面几个字
    Y=[]
    for yyy in range(2):    # 一共3条
        Y.append(yy[yyy][2:])         # 不要“1、”、“2、”、“3、”
        LIST.append(yy[yyy][2:])
    # print(Y)
    # ['为春游活动做准备。', '在家长的帮助下学习折一些纸花。', '天气转暖,适当地为孩子减少衣服。']
    

    # # 反馈与调整(变化很大)不导入
    ff=table.cell(1,8).text.split('\n')
    # print(ff)
    # print(h+1,len(ff))
    # # 8行
    
    
    for j in range(2):
        # 提取活动1
        LIST.append(ff[j*4][0:4])    
        # # 提取身份1
        LIST.append(ff[j*4][10:-1])
        # 提取反思1
        LIST.append(ff[j*4+1])
        # print(LIST)
    #     # # 提取调整1
        LIST.append(ff[j*4+3])
    # print(LIST)

    
    print('-----提取第2-5张表格(教案)里面的内容----------')
    # 第1周、第20周,或国庆周会出现格子表格不满的情况,需要手动调整

    # 获取第5行段落文字
    bt2=doc.paragraphs[6].text
    print(bt2)
    
    # 找到“期”和“第”的位置  短日期
    start_index = bt2.find('期')
    end_index = bt2.find('第')
    
    # 提取“期”到“第”之间的文字并去掉空格
    if start_index != -1 and end_index != -1:
        if start_index < end_index:
            date1 = bt2[start_index + 1: end_index].strip()
            print(date1)

    LIST.append(date1)    # 添加短日期

    # 找到“期”和“第”的位置  短日期
    start_index = bt2.find('(')
    end_index = bt2.find(')')
    
    # 提取“期”到“第”之间的文字并去掉空格
    if start_index != -1 and end_index != -1:
        if start_index < end_index:
            date2 = bt2[start_index + 1: end_index].strip()
            print(date2)



    LIST.append(date2)    # 添加添加周次

    for a in range(1,3): # 先提取2张表(  共有3张表,其中第1、2张表提取00和01,第3表提取00)  
        for b in range(2):        # 表1有两个格子00 01 表2有两个格子00 01
            
            table = tables[a]        # 表1 表2 

            # 有两张表
            all=table.cell(0,b).text.split('\n')
            print(len(all))
            # 看看表格里面的行数,如果等于1行(元宵节放假),就写6个空格
            if len(all)==1:
                for tt in range(6):
                    LIST.append('')
             # 看看表格里面的行数,如果大于1行,就不断写入内容
            else:
                # print(all)

                # 提取活动名称(删除后面的执教人员)
                title=all[0][5:][:-6]
                title1 = title.replace(" ", "")
                LIST.append(title1)
                
                # print(title)
                # 空中小屋等4个题目

                # 提取活动目标(2行)删除前面的序号
                topic=[]
                for to in range(2,4):    # 行数
                    mb=all[to][2:]
                    LIST.append(mb)

                    # topic.append(all[to][2:])
                    
                # print(topic)
                # ['理解故事,知道春天是竹笋快速生长的季节。', '乐意想办法帮助小狐狸解决问题,并能大胆表达自己的想法。']

                # 提取活动准备
                # (第一种:经验准备)
                pre1=all[5][5:]
                LIST.append(pre1)
                # print(pre)
                # (第二种:材料准备)
                pre2=all[6][5:]
                LIST.append(pre2)
                # print(pre2)

                # ppt、故事录音

                # 提取活动过程
                pro=all[8:]
                PRO='\n'.join(pro)
                # print(PRO)
                LIST.append(PRO)
                # 一、我家住几楼---导入主题,激起幼儿兴趣
                # 1、你们的家住在哪里?住在几楼?为什么买这么高?
                # 小结:是呀,住这么高的房子可以看到远远的风景。
                # 2、小狐狸也想住楼房,楼上的房间高高的,远远望去,可以看见一片美景,那该多开心。
                # 二、房子造在哪?---分段欣赏

    for a in range(3,4): # 最后提取第3张表的00部分
        for b in range(1):        # 表1有两个格子00 01 表2有两个格子00 01
            
            table = tables[a]        # 表1 表2 
            # 有两张表
            all=table.cell(0,b).text.split('\n')
            if len(all)==1:
                LIST.append('')

            # print(all)
            else:
                # 提取活动名称(删除后面的执教人员)
                title=all[0][5:][:-6]
                title1 = title.replace(" ", "")
                LIST.append(title1)
                
                # print(title)
                # 空中小屋 只有一个标题

                # 提取活动目标(2行)删除前面的序号
                topic=[]
                for t in range(2,4):    # 行数
                    topic.append(all[t][2:])
                    LIST.append(all[t][2:])
                # print(topic)
                # ['理解故事,知道春天是竹笋快速生长的季节。', '乐意想办法帮助小狐狸解决问题,并能大胆表达自己的想法。']

                # 提取活动准备
                # (第一种:经验准备)
                pre1=all[5][5:]
                LIST.append(pre1)
                # print(pre)
                # (第二种:材料准备)
                pre2=all[6][5:]
                LIST.append(pre2)
                # print(pre2)

                # 提取活动过程
                pro=all[8:]
                # print(pro)
                # # 这是列表样式
                # ['一、我家住几楼---导入主题,激起幼儿兴趣', '1、你们的家住在哪里?住在几楼?为什么买这么高?', '小结:是呀,住这么高的房子可以看到远远的风景。', '2、小狐狸也想住楼房,楼上的房间高高的,远远望去 
                # ,可以看见一片美景,那该多开心。', '二、房
                # 合并列表
                PRO='\n'.join(pro)
                # print(PRO)
                LIST.append(PRO)
                # 一、我家住几楼---导入主题,激起幼儿兴趣
                # 1、你们的家住在哪里?住在几楼?为什么买这么高?
                # 小结:是呀,住这么高的房子可以看到远远的风景。
                # 2、小狐狸也想住楼房,楼上的房间高高的,远远望去,可以看见一片美景,那该多开心。
                # 二、房子造在哪?---分段欣赏

    
        for c in range(2):        # 表3的01有两个上下格子  表2有两个格子00 01
            table = tables[3]        # 表3
            
            # 有两张表
            fs=table.cell(c,1).text.split('\n')
            # print(fs)
            # 提取反思的课程名字
            # 提取活动名称(删除后面的执教人员)
            fstitle=fs[1][5:][:-6]
            # print(fstitle)
            LIST.append(fstitle)
        
            # 纯反思部分(第三行开始)    
            fs1=fs[2:]
            # print(fs1)
            fs3=[]
            for i in range(len(fs1)):
                fs4='         '+fs1[i]        # 主动添加缩进2字符
                # print(fs4)
                fs3.append(fs4)

            # 合并列表
            fs2='\n'.join(fs3)
            # print(fs2)
            LIST.append(fs2)

    extracted_texts = []

    # 遍历前5张表格
    for table in doc.tables[:5]:
        # 获取第1行单元格内容
        first_row_cells = table.rows[0].cells

        # 提取“执教:”和回车符之间的文字并去除空格
        for cell in first_row_cells:
            cell_text = cell.text.strip()
            if '执教:' in cell_text:
                start_index = cell_text.find('执教:') + len('执教:')
                end_index = cell_text.find('\n')
                extracted_text = cell_text[start_index:end_index].strip()
                extracted_texts.append(extracted_text)

    # 打印提取的文字
    for T in extracted_texts:
        print(T)    
        LIST.append(T)

        # # 教师T1 T2
        # for teacher in range(5):
        #     T1='教师'            
        #     LIST.append(T1)
           


        

# print(LIST)   
   
    for g in range(len(LIST)):
        # K =[1,3,4,6,8,10]#要写入的列表的值
        sheet1.write(n,g,LIST[g])#写入数据参数对应 行,列,值


        

    n+=1
f.save(r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\09 原计划提取的内容(仅导出部分).xls')#保存.x1s到当前工作目录




# doc.close(path)

time.sleep(5)


print('--打开XLSX-,把里面的空格删除,把1、替换成1.--')# 



# # 关闭Excel文件
# workbook.close()
import xlrd
import xlwt

# 打开Excel文件
workbook = xlrd.open_workbook(r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\09 原计划提取的内容(仅导出部分).xls')

worksheet = workbook.sheet_by_index(0)  # 选择要读取的工作表

# 创建一个新的Workbook对象
new_workbook = xlwt.Workbook()
new_worksheet = new_workbook.add_sheet('Sheet1')  # 新建一个工作表

# 遍历每一行
for row_index in range(worksheet.nrows):
    row_values = worksheet.row_values(row_index)
    for col_index, cell_value in enumerate(row_values):
        if isinstance(cell_value, str):
            # 清除单元格内文字的格式
            cell_value = cell_value.strip()

            # 替换文本
            for s in range(1, 10):
                cell_value = cell_value.replace("{}、".format(s), "{}.".format(s))

            
            cell_value = cell_value.replace(' ', '')
            cell_value = cell_value.replace(' ', '')
            cell_value = cell_value.replace( "  ", '')
           

            # # 判断单元格中的文字是否有空格
            # if ' ' in cell_value:
            #     # 替换空格为无空格
            #     cell_value = cell_value.replace(' ', '')

            # if ' ' in cell_value:
            #     # 替换空格为无空格
            #     cell_value = cell_value.replace(' ', '')

            # 替换文本
            for s in range(1, 10):
                cell_value = cell_value.replace("{}、".format(s), "{}.".format(s))

        # 将修改后的值写入新的Workbook中
        new_worksheet.write(row_index, col_index, cell_value)

# 保存修改后的Excel文件
new_workbook.save(r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\09 原计划提取的内容(仅导出部分).xls')
# new_workbook.save(r'D:\test\02办公类\91周计划4份_2024年中4班\04 周计划\09 原计划提取的内容(修改用版本).xls')

把提取出来的“仅导出部分”,复制一份,改成“修改补充版”(主要修改基本信息(班级、日期、周次、班主任)

以下是手动修改信息:

修改一份“改过日期、班级、班主任名字”的EXCEl模板

  • 29
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿夏reasonsummer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值