导入Word文档

导入Word文档
开发工具与关键技术:Visual Studio 2015 导入Word文档
作者:袁何恩
撰写时间:2019年5月27日
今天,我要和大家分享的技术是导入word文档。
导入word文档是把word文档保存到临时的文件夹里,也就是Session里,是以一个word格式保存,再把word文档转化为HTML文件的格式,转换为HTML文件,再通过正则表达式,把想要的筛选出来,删除不必要的标签。
一、 保存word文档。
1、在视图上写上提交表单的方法,代码图如下:
在这里插入图片描述
2、在控制器中写上word文档保存的代码。先写上HttpPostedFileBase file来接收页面传来的文件,再判断页面传来的文件是否为空,判断后缀名是否是docx、doc,再自定义文件名,避免文件名重复,再把word文档保存到临时的文件夹里,也就是Session里,是以一个word格式保存,这需要有文件保存的路径 判断路径是否存在,如果存在就直接拼接路径,不存在就创建路径,再拼接。代码图如下:
在这里插入图片描述
图中HttpPostedFileBase file接收页面传来的文件的意思,file 是页面传来的文件的意思, file != nul是判断页面传来的文件是否为空的意思,GetExtension是获取文件的后缀名的意思,HttpPostedFileBase是充当类的基类,这些类提供对客户端已上载的单独文件的访问,DateTime是当前的时间,FileName是在派生类中重写时,获取客户端上文件的完全限定名,Combine是将两个字符串组合成一个路径,Server是获取提供Wed请求处理期间使用的方法的HttpPostedFileBase 对象,MapPath是在派生类重写时,返回与Web服务器上的指定虚拟路径相对应的物理文件路径。SaveAs是在派生类中重写时,保存上载文件的内容。
二、 把word文档转化为HTML文件的格式。
1、 先转换为HTML文件,再保存到相应的路径,把原来的fileName里面的获取到的fileExtension(文件的扩展名),加上".html",更替扩展名,然后,引用“Spire.Doc.for .NET”, “Spire.Doc.for .NET”是一款专业的Word .NET类库,用于快速创建,读取,写入,转换,打印Word文档。从相应路径将文件读取到document中,路径是之前存放word文档的路径。将文件转化为html格式并保存到另一个指定的路径下,在把file保存在我们拼接好的路径下面代码图如下:
在这里插入图片描述
图中Replace是返回一个新字符串,其中当前实例中出现的所有指定字符串都替换为另一个指定的字符串。Document是先引用“Spire.Doc.for .NET”,才有的。Path是对包含文件或目录路径信息的string实例执行操作。这些操作是以跨平台的方法式执行的。
2、另存为html。另存为html,读取html里所有的内容,再用正则表达式,将HTML中的

替换为带有自定义属性的p标签,提取所有的P标签,代码图如下:
在这里插入图片描述
图中Replace是在指定的输入字符串内,使用指定的替换字符串替换与指定正则表达式匹配的所有的字符串,Rege是表达不可变的正则表达式。ReadAllText是打开一个文本文件,读取文件的所有行,然后关闭该文件,Matches是在指定的输入字符串中搜索指定的正则表达式的所有匹配项。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值