有一个非常简单的方法(尽管是一个无用的)来实现这一点。如果它只是一个关闭,只需打开带有excel表格的htm/html文件,然后将表格保存为.csv文件(如果文件中的表格外有任何数据,则可以轻松地从excel中删除该表格)。
如果你要重复这个任务中,你可以使用C#的Microsoft.Office.Interop.Excel命名空间(或VB .NET),以它的几行,像这样的自动化:
using Microsoft.Office.Interop.Excel;
...
Application app = new Application();
app.ScreenUpdating = false;
app.DisplayAlerts = false;
app.AskToUpdateLinks = false;
app.Visible = false;
Workbook workbook = app.Workbooks.Open(fileName + ".html", false, false,
Type.Missing, Type.Missing, Type.Missing, Type.Missing,
Type.Missing, Type.Missing,
Type.Missing, Type.Missing, Type.Missing, Type.Missing,
Type.Missing, Type.Missing);
workbook.SaveAs(fileName + ".csv", Microsoft.Office.Interop.Excel.XlFileFormat.xlCSV);
workbook.Close(false, Type.Missing, Type.Missing);
workbook = null;
app.Quit();
app = null;
...
而对于这如果需要,应该很容易在表格标签中使用正则表达式解析html文件中的非表格。在Visual Studio 2005中,您只需右键单击项目的引用,然后在.Net选项卡下找到Microsoft.Office.Interop.Excel。