你想要什么,构建一个工具来做到这一点的方法,或一个工具,为你做到这一点?我没有后者,但我确实知道做前者的方法。 (这是一个编程论坛:-)
下面的delphi/freepascal程序/脚本从latex 2 html转换器(tex4ht)中加载多文件HTML输出,修复了断开的链接,重建了单独的TOC和折叠(kwd)带有关键字的文件放入索引中。
你可以尝试进一步提高这一具有HTML解析程序来扫描关键字,手动筛选它们,然后反馈给修改脚本,从CHM解压缩的输出开始。 (CHM解压缩工具附带Free Pascal 2.4.4,这些还可以将CHM内部文件存储为普通文件,因此您可以在代中重复使用它们)
脚本看起来很复杂,但这部分是由于它会重写HTML代码(主题标题,TOC突变,链接修复)。
更新以下评论。
CHM软件包不生成索引。文档工具(delphicodetodoc或fpdoc)必须将相关索引信息传递给CHM编译器。无论是作为XML还是构建调用各种方法的树。如果你的html是由像delphitodoc这样的工具生成的,那么使用上面的方法尝试自己重建索引是疯狂的。该工具具有更高层次的视图,可以生成更高质量的索引,并且可能适应性更低。
请注意,我假设你真的是指索引,而不是全文搜索,它是自动的。
我不知道delphicodetodoc是如何工作的(以及由于严酷的构建要求,我不会去尝试),但问题听起来像delphicodetodoc在CHM世代中并不是那么好。
fpdoc作为设计决定,它不会做源内文档(被认为是混乱的),我不认为这将会改变。