- 博客(85)
- 资源 (9)
- 收藏
- 关注
原创 结合sigil和ebooklib及beautifulsoup配合改造epub电子书
本文演示了利用sigil的正则表达式替换功能修改epub文件中html文件的结构,再结合ebooklib和beautifulsoup库修改html文件中标签的有关属性并保存epub文件中。
2025-01-10 10:50:22
736
原创 使用ebooklib制作符合epub3规范的epub文件
本文综合利用word及Python电子书制作库,将一个OCR的pdf文件改造成了支持epub3规范的弹出式注释的epub文件。
2025-01-01 20:27:53
719
原创 VBA中按段落遍历Word文档修改段落文本时的正确方法
本文介绍了使用VBA按段落遍历Word文档时,如需修改整个段落的内容应当采取的正确做法,即先构造出一个不包括段落末尾的分段符的区域再进行赋值。
2024-12-29 10:01:53
397
原创 用VBA将word文档处理成支持弹出式注释的epub文档可用的html内容
因为扫描文档在Word中校核并编辑出结构比较方便,因此以上通过VBA来处理Word中的文本,实际上,如果弄清了epub3标准的弹窗显示注释的要求,对不符合标准的Epub/HTML文件,也可以利用python的soup库进行修改,使其符合标准,那又是另一个主题了。点击注释引用后,对应的注释内容会弹出在页面中显示,再次点击弹窗外的任意位置该弹窗即关闭,关闭后点击任意注释引用,对应的注释内容会弹窗显示。处理好注释引用与注释编号的文档改造成符合上述规范的html文件所需内容。
2024-12-24 16:51:55
791
原创 用VBA自动更正错误的注释引用序号
本文介绍了一个自动更正序数错误的带圈数字序号注释引用与注释编号的宏,演示了正则表达式结合Range.Find进行查找并完成匹配内容定位、查找范围的调整、取得标题及其所属段落区域、数值1-20转换为带圈数字序号等技巧。
2024-12-24 15:07:55
329
原创 在VBA中结合正则表达式和查找功能给文档添加交叉连接
本文通过结合正则表达式和`Range.Find`对象在文档的主体内容中的注释引用与注释内容中的注释编号之间建立了交叉链接,演示了在选定区域用`Range.Find`对象进行查找和准确定位文档中所有匹配正则表达式的对象的方法。
2024-12-20 09:25:59
487
原创 将带注释的Word文档改造成点击注释引用即可弹窗显示注释的HTML文档
本文结合VBA和JavaScript将带注释的曹植集注中的一首诗改造成了可以通过点击注释引用即在点击位置显示注释的HTML,以供制作更方便在平板等平台阅读的epub格式书籍。
2024-12-15 20:04:37
484
原创 利用cnocr库完成中文扫描pdf文件的文字识别
本文用pymupdf、numpy和cnocr库完成了一个将扫描pdf文件通过OCR转换成txt文件的python程序。
2024-12-11 18:57:21
468
原创 消除对比度增强后的图片中产生的噪点
本文通过将一个示例彩色pdf文档转换为二值图片组成的pdf文档,演示了pdf与图片文件的相互转换(通过pymupdf库和pillow库),彩色图片自适应对比度增强(利用OpenCV库)、彩色图片二值化处理以及利用掩码图片除掉图片中噪点的方法。
2024-11-25 11:04:37
378
原创 用python将一个扫描pdf文件改成二值图片组成的pdf文件
本文通过综合利用pillow、pymupdf和numpy三个库,将彩色或灰度扫描pdf文件转换成有二值图片组成的pdf文件,以便于在黑白墨水屏上阅读。程序中演示了pymupdf.Pixmap与numpy.ndarray和pillow.Image.Image之间的转换。
2024-11-22 21:57:04
622
1
原创 python的正则表达式模块中re.match、re.search和re.finditer的区别及多行文本用re.sub替换内容时遇到KeyError: ‘\\p‘的变通解决方法
本文简要归纳了python的正则表达式模块这re.match、re.search和re.finditer的区别,并介绍了一种避免多行文本用re.sub替换内容时遇到KeyError: '\\p'错误的方法。
2024-10-29 13:39:56
319
原创 Anki插件Export deck to html的改造
本文修改并完善了Anki插件Export deck to html的功能,同时简要介绍了利亚该插件结合html模板文件将Anki牌组导出为html的方法。
2024-10-28 16:27:33
872
1
原创 用VBA将一个Word文档中符合某些条件的内容抽取到另一个文档中
源文档中部分内容的标题被标注不同数量的★,用VBA将标注为四个以上★的标题及其所属正文内容抽取出来存入新文档中。实际上,修改此文代码中过滤内容的条件,可以改造成抽取符合任意条件的内容的宏。
2024-08-27 16:12:06
556
原创 用正则表达式匹配HTML标签
本文介绍了如何编写匹正则表达式匹配HTML标签,并给出了一个较复杂的应用问题——保留一段HTML片段中不带属性的div标签和p标签,但是删除带属性的div标签和p标签——的解决方案。
2024-07-28 14:13:07
1735
原创 CSS3实现提示工具的渐入渐出效果及CSS3动画简介
本文通过实现tooltip工具的渐入渐出效果,以一种简洁明晰的方式简要介绍了CSS3的动画相关知识。因为本人并非高手,所以文中没有复杂炫技,初学者也足以通过本文快速理解并掌握相关原理。
2024-07-17 10:41:16
1293
原创 用HTML和CSS实现提示工具(tooltip)及HTML元素的定位
本文利用HTML元素的position样式和visibility样式实现了一个提示工具(tooltip)示例,其中涉及到了元素的hover伪类,visibility样式和position样式等知识。
2024-07-13 19:38:58
1925
原创 对兼容各操作系统的Anki选择题模板的更新——提供更方便的笔记修改功能
利用并改造Anki插件Edit Field During Review,通过JavaScript为在复习界面中对笔记内容进行突出显示提供更方便的操作。
2024-06-22 22:19:27
1609
11
原创 利用CSS隐藏HTML元素并插入替代内容
通过实现一个支持切换答题模式与阅读模式的Anki问答题模板,演示不使用JavaScript就删除某些HTML结点在页面上的显示以及插入自己的内容。
2024-06-09 15:49:50
588
2
原创 利用VBA删除Word文档中所有空白页面
这个思路似乎是不错的,但是如果页面中含有表格,甚至表格中存在合并单元格,特别是表格中还存在跨页的单元格的话,那么Selection.Information(wdFirstCharacterLineNumber) 方法取得的数值实际上是错误的,也就是说在页面包含表格的情况下,可能无法准确获取这一页的行数。所以,上述思路实际上不够通用。更通用的思路是遍历文档中的所有页面,依次选择各页的全部内容,然后将不可打印字符全部替换为空字符,如果替换完成后的字符串长度不大于1,那么就可以判定这一页为空白页,将其删除即可。
2024-04-06 16:10:41
1060
原创 Word中解决插入脚注导致的分页位置错误问题
上面的截图中,样式为标题3的段落“四、固执的念头”前插入了连续型分节符,并且该分节符的样式为正文,前后的正文段落中有脚注,结果在分页时,标题3段落“四、固执的念头”后的正文段落自动进入了第二页,此时,如果不改变Word默认设置,除非手工插入分页符(或者连续键入空行,但强烈反对这种方式)将标题3段落“四、固执的念头”挤入下一页,标题3段落“四、固执的念头”与其后的正文段落始终不能排版到同一页,将该段落的换行分页方式设置为“与下段同页”也不起作用。
2024-03-11 09:38:23
2996
原创 Word中的文档网格线与行距问题
第上面的动图里,将文字大小放大到某个字号时,单倍行距的间距突然增加很多。造成这种情况的原因是文档中定义了网格线,并且设置了对齐到网格线。上面的动图演示了如何取消对齐到网格线,动图中文字的行间距在取消对齐到网格线后缩小到可以接受的程度了。还可以一劳永逸地干脆取消文档中的网格线。将文档设置成无网格后,无需再在段落格式对话框中取消对齐到文档网格线。
2024-03-05 09:16:33
1732
原创 使用Flex布局在HTML中实现双行夹批效果
中只需要先选择批注文字,然后通过“开始”菜单“段落”面板上字符缩放工具组里的“双行合一”命令,就可以很容易实现双行夹批效果。),其次是对所有需要双行显示的内容,需要针对每一块内容确定合适的宽度,否则没有理想的双行夹批显示效果。古代小说中经常有评点和批注,为了区别正文和批注,一般将批注排版成双行夹批的形式。,还是不能防止元素尺寸过大时不同的子元素被换行显示(即使子元素是行内元素。局限性还是很大的,首先是子元素尺寸超过容器的宽度或高度时,即使使用了。/*子元素的对齐方式,主要靠这个实现文字的垂直方向对齐*/
2024-02-21 12:22:51
635
原创 文档目录、页眉和文档章节标题之间插入相互链接的最佳实践
在每个章节前插入分节符以及给每节添加不同的页眉,并且实现点击每节的标题和页眉也能跳转到目录的相应位置,对于长文档来说,用手工输入肯定是比较困难的。本文介绍了几个相互配合实现这一功能的宏,从中也可以学习用VBA操作页眉页脚、目录和书签、超链接以及域。
2024-02-04 19:23:05
1646
兼容各操作系统平台的anki选择题模板
2023-07-16
兼容所有平台的anki选择题模板.apkg
2021-07-02
js对象参考中文文档
2016-07-15
bootstrap中文文档
2016-07-15
Angular中文文档
2016-07-15
数学表达式解释器
2015-04-06
一个迷宫程序源代码
2013-08-07
利用自定义渲染器实现JSF数据库表分页显示
2010-06-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人