2
回答
回答:我最近也在学:仅有的一点资料
import java.io.*;
import java.util.*;
import org.apache.poi.poifs.filesystem.*;
import org.apache.poi.util.LittleEndian;
public class WordTest {
public WordTest() {
}
public static boolean writeWordFile(String path, String content) {
boolean w = false;
try {
// byte b[] = content.getBytes( "ISO-8859-1 ");
byte b[] = content.getBytes();
ByteArrayInputStream bAIs = new ByteArrayInputStream(b);
POIFSFileSystem fs = new POIFSFileSystem();
DirectoryEntry directory = fs.getRoot();
DocumentEntry de = directory.createDocument( "WordDocument ", bAIs);
FileOutputStream ostream = new FileOutputStream(path);
fs.writeFilesystem(ostream);
bAIs.close();
ostream.close();
} catch (IOException e) {
e.PRintStackTrace();
}
return w;
}
public static void mAIn(String[] args){
boolean b = writeWordFile( "E://test.doc ", "hello ");
}
}
/*
public String extractText(InputStream in) throws IOException {
ArrayList text = new ArrayList();
POIFSFileSystem fsys = new POIFSFileSystem(in);
DocumentEntry headerProPS = (DocumentEntry) fsys.getRoot().getEntry( "WordDocument ");
DocumentInputStream din = fsys.createDocumentInputStream( "WordDocument ");
byte[] header = new byte[headerProPS.getSize()];
din.read(header);
din.close();
// Prende le inFormazioni dall 'header del documento
int info = LittleEndian.getShort(header, 0xa);
boolean useTable1 = (info & 0x200) != 0;
//boolean useTable1 = true;
// Prende inFormazioni dalla piece table
int complexOffset = LittleEndian.getInt(header, 0x1a2);
//int complexOffset = LittleEndian.getInt(header);
String tableName = null;
if (useTable1) {
tableName = "1Table ";
} else {
tableName = "0Table ";
}
DocumentEntry table = (DocumentEntry) fsys.getRoot().getEntry(tableName);
byte[] tableStream = new byte[table.getSize()];
din = fsys.createDocumentInputStream(tableName);
din.read(tableStream);
din.close();
din = null;
fsys = null;
table = null;
headerProPS = null;
int multiple = findText(tableStream, complexOffset, text);
1
回答
2021-03-15
浏览:0
分类:办公入门
回答:http://www.bc-cn.net/bbs/dispbbs.asp?boardid=15&id=90248
我帮你问了 你自己去看吧
2
回答
2021-03-09
浏览:0
分类:办公入门
回答:步骤:
1,用Word编辑你的模板
2,模板保存为html格式
3,在代码中把你要填的值动态拼接到那个html中,
最后
byte[] bytes= bf.toString().getBytes("GBK"); //bf.tostring()得到的拼接后的字符串
response.reset();
response.setContentType("application/mSWord");
response.setHeader("Content-disposition", "inline; filename=case_PRint.doc");
response.setCharacterEncoding("GBK");
response.setContentLength(bytes.length);
ServletOutputStream ouputStream = response.getOutputStream();
ouputStream.write(bytes, 0, bytes.length);
ouputStream.flush();
ouputStream.close();
2
回答
2021-03-09
浏览:0
分类:办公入门
回答:作为第一个程序,很多人会选择Hello World,在java里,可使用控制台程序实现这个功能,具体步骤如下:
1、编写代码Hello.java(可直接使用记事本编写,存储到c:\下)
public class Hello
{
public static void mAIn (String[] args) throws java.lang.Exception
{
System.out.PRintln("hello world!");
}
}
2、安装jre或jdk
运行cmd命令,输入java -version,可以看到版本信息则说明java环境正常
3、在cmd窗口中,进入c:\,输入javac Hello.java
4、在cmd窗口中,输入java Hello,看到hello world!
2
回答
回答:在线查看office文件这种功能应该是需要插件支持的。
1
回答
2020-11-23
浏览:18
分类:办公入门
回答:File file = new File("XXX.doc");
Scanner input = new Scanner(file);
然后调用Scanner 类的方法就行,欢迎追问
1
回答
2020-11-23
浏览:6
分类:办公入门
回答:java打开Word文档的话,应该要使用一些开源的工具,
1
回答
回答:
Word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。
如果需要安装Word分词器可以参考下面的步骤:1、确保电脑上已经安装了JDK软件和Eclispe工具,没有安装的可以到对应的官网下载安装:
JDK官网:http://www.oracle.com/technetwork/java/javase/downloads/index.html
EcliPSe官网:http://www.ecliPSe.org2、下载Word分词器的相关jar包:
打开Word分词器的官方github主页:httPS://github.com/ysc/Word
下拉找到ReadME部分,点击“编译好的jar下载”:
页面将会跳转到到百度云盘的下载页面,按照需求下载指定的版本即可。
注意:Word1.3需要JDK1.8。
下载完成之后解压到指定目录。3、创建Java项目,导入Word分词器的相关jar包:
打开EcliPSe,右键创建Java PRoject项目:
然后右键项目选择BUIld path打开导入页面,导入刚才下载的jar包到项目中:
导入成功之后就可以在自己的项目中使用Word分词器了。
2
回答
2021-03-07
浏览:0
分类:办公入门
回答:
创建Word文档的前提就是电脑上已经安装了Word
在桌面右键-新建,然后选择Microsoft Word文档就能新建Word文档
或者用命令打开新的Word文档。Win+R,弹出运行对话框后,输入“WinWord”,也能创建一个新的Word文档
1
回答
2021-01-27
浏览:9
分类:办公入门
回答:可以考虑Apache POI ,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。
1、import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
2、import org.apache.poi.hwpf.extractor.WordExtractor;
/**读取Word文本信息*/
public class WordDemo {
public static void mAIn(String[] args) {
2
回答
2020-10-20
浏览:6
分类:办公入门
回答:打开Word,保存就有了
也可以在你要创建Word的文件的地方点鼠标右键,新建,就有Word文件,然后命名,打开就可以使用了
1
回答
2021-01-25
浏览:9
分类:办公入门
回答:参考如下
1、快速体验
运行项目根目录下的脚本demo-Word.bat可以快速体验分词效果
用法: command [text] [input] [output]
命令command的可选值为:demo、text、file
demo
text 杨尚川是APDPlat应用级产品开发平台的作者
file d:/text.txt d:/Word.txt
exit
2、对文本进行分词
移除停用词:List Words = WordSegmenter.seg("杨尚川是APDPlat应用级产品开发平台的作者");
保留停用词:List Words = WordSegmenter.segWithStopWords("杨尚川是APDPlat应用级产品开发平台的作者");
System.out.PRintln(Words);
输出:
移除停用词:[杨尚川, apdplat, 应用级, 产品, 开发平台, 作者]
保留停用词:[杨尚川, 是, apdplat, 应用级, 产品, 开发平台, 的, 作者]
3、对文件进行分词
String input = "d:/text.txt";
String output = "d:/Word.txt";
移除停用词:WordSegmenter.seg(new File(input), new File(output));
保留停用词:WordSegmenter.segWithStopWords(new File(input), new File(output));
4、自定义配置文件
默认配置文件为类路径下的Word.conf,打包在Word-x.x.jar中
自定义配置文件为类路径下的Word.local.conf,需要用户自己提供
如果自定义配置和默认配置相同,自定义配置会覆盖默认配置
配置文件编码为UTF-8
5、自定义用户词库
自定义用户词库为一个或多个文件夹或文件,可以使用绝对路径或相对路径
用户词库由多个词典文件组成,文件编码为UTF-8
词典文件的格式为文本文件,一行代表一个词
可以通过系统属性或配置文件的方式来指定路径,多个路径之间用逗号分隔开
类路径下的词典文件,需要在相对路径前加入前缀classpath:
指定方式有三种:
指定方式一,编程指定(高优先级):
WordConfTools.set("dic.path", "classpath:dic.txt,d:/custom_dic");
DictionaryFactory.reload();//更改词典路径之后,重新加载词典
指定方式二,Java虚拟机启动参数(中优先级):
java -Ddic.path=classpath:dic.txt,d:/custom_dic
指定方式三,配置文件指定(低优先级):
使用类路径下的文件Word.local.conf来指定配置信息
dic.path=classpath:dic.txt,d:/custom_dic
如未指定,则默认使用类路径下的dic.txt词典文件
6、自定义停用词词库
使用方式和自定义用户词库类似,配置项为:
stopWords.path=classpath:stopWords.txt,d:/custom_stopWords_dic
7、自动检测词库变化
可以自动检测自定义用户词库和自定义停用词词库的变化
包含类路径下的文件和文件夹、非类路径下的绝对路径和相对路径
如:
classpath:dic.txt,classpath:custom_dic_dir,
d:/dic_more.txt,d:/DIC_DIR,D:/DIC2_DIR,my_dic_dir,my_dic_file.txt
classpath:stopWords.txt,classpath:custom_stopWords_dic_dir,
d:/stopWords_more.txt,d:/STOPWordS_DIR,d:/STOPWordS2_DIR,stopWords_dir,remove.txt
8、显式指定分词算法
对文本进行分词时,可显式指定特定的分词算法,如:
WordSegmenter.seg("APDPlat应用级产品开发平台", SegmentationAlgorithm.BidirectionalMaximumMatching);
SegmentationAlgorithm的可选类型为:
正向最大匹配算法:MaximumMatching
逆向最大匹配算法:ReverseMaximumMatching
正向最小匹配算法:MinimumMatching
逆向最小匹配算法:ReverseMinimumMatching
双向最大匹配算法:BidirectionalMaximumMatching
双向最小匹配算法:BidirectionalMinimumMatching
双向最大最小匹配算法:BidirectionalMaximumMinimumMatching
全切分算法:FullSegmentation
最少分词算法:MinimalWordCount
最大Ngram分值算法:MaxNgramScore
9、分词效果评估
运行项目根目录下的脚本evaluation.bat可以对分词效果进行评估
评估采用的测试文本有253 3709行,共2837 4490个字符
评估结果位于target/evaluation目录下:
corpus-text.txt为分好词的人工标注文本,词之间以空格分隔
test-text.txt为测试文本,是把corpus-text.txt以标点符号分隔为多行的结果
standard-text.txt为测试文本对应的人工标注文本,作为分词是否正确的标准
reSUlt-text-***.txt,***为各种分词算法名称,这是Word分词结果
perfect-reSUlt-***.txt,***为各种分词算法名称,这是分词结果和人工标注标准完全一致的文本
wrong-reSUlt-***.txt,***为各种分词算法名称,这是分词结果和人工标注标准不一致的文本
1
回答
2021-03-09
浏览:1
分类:办公入门
回答:这个打开也没用,那是临时文件,等你保存后这些临时文件会自动清除。
1
回答
2021-01-25
浏览:5
分类:办公入门
回答:参考如下
1、快速体验
运行项目根目录下的脚本demo-Word.bat可以快速体验分词效果
用法: command [text] [input] [output]
命令command的可选值为:demo、text、file
demo
text 杨尚川是APDPlat应用级产品开发平台的作者
file d:/text.txt d:/Word.txt
exit
2、对文本进行分词
移除停用词:List Words = WordSegmenter.seg("杨尚川是APDPlat应用级产品开发平台的作者");
保留停用词:List Words = WordSegmenter.segWithStopWords("杨尚川是APDPlat应用级产品开发平台的作者");
System.out.PRintln(Words);
输出:
移除停用词:[杨尚川, apdplat, 应用级, 产品, 开发平台, 作者]
保留停用词:[杨尚川, 是, apdplat, 应用级, 产品, 开发平台, 的, 作者]
3、对文件进行分词
String input = "d:/text.txt";
String output = "d:/Word.txt";
移除停用词:WordSegmenter.seg(new File(input), new File(output));
保留停用词:WordSegmenter.segWithStopWords(new File(input), new File(output));
4、自定义配置文件
默认配置文件为类路径下的Word.conf,打包在Word-x.x.jar中
自定义配置文件为类路径下的Word.local.conf,需要用户自己提供
如果自定义配置和默认配置相同,自定义配置会覆盖默认配置
配置文件编码为UTF-8
5、自定义用户词库
自定义用户词库为一个或多个文件夹或文件,可以使用绝对路径或相对路径
用户词库由多个词典文件组成,文件编码为UTF-8
词典文件的格式为文本文件,一行代表一个词
可以通过系统属性或配置文件的方式来指定路径,多个路径之间用逗号分隔开
类路径下的词典文件,需要在相对路径前加入前缀classpath:
指定方式有三种:
指定方式一,编程指定(高优先级):
WordConfTools.set("dic.path", "classpath:dic.txt,d:/custom_dic");
DictionaryFactory.reload();//更改词典路径之后,重新加载词典
指定方式二,Java虚拟机启动参数(中优先级):
java -Ddic.path=classpath:dic.txt,d:/custom_dic
指定方式三,配置文件指定(低优先级):
使用类路径下的文件Word.local.conf来指定配置信息
dic.path=classpath:dic.txt,d:/custom_dic
如未指定,则默认使用类路径下的dic.txt词典文件
6、自定义停用词词库
使用方式和自定义用户词库类似,配置项为:
stopWords.path=classpath:stopWords.txt,d:/custom_stopWords_dic
7、自动检测词库变化
可以自动检测自定义用户词库和自定义停用词词库的变化
包含类路径下的文件和文件夹、非类路径下的绝对路径和相对路径
如:
classpath:dic.txt,classpath:custom_dic_dir,
d:/dic_more.txt,d:/DIC_DIR,D:/DIC2_DIR,my_dic_dir,my_dic_file.txt
classpath:stopWords.txt,classpath:custom_stopWords_dic_dir,
d:/stopWords_more.txt,d:/STOPWordS_DIR,d:/STOPWordS2_DIR,stopWords_dir,remove.txt
8、显式指定分词算法
对文本进行分词时,可显式指定特定的分词算法,如:
WordSegmenter.seg("APDPlat应用级产品开发平台", SegmentationAlgorithm.BidirectionalMaximumMatching);
SegmentationAlgorithm的可选类型为:
正向最大匹配算法:MaximumMatching
逆向最大匹配算法:ReverseMaximumMatching
正向最小匹配算法:MinimumMatching
逆向最小匹配算法:ReverseMinimumMatching
双向最大匹配算法:BidirectionalMaximumMatching
双向最小匹配算法:BidirectionalMinimumMatching
双向最大最小匹配算法:BidirectionalMaximumMinimumMatching
全切分算法:FullSegmentation
最少分词算法:MinimalWordCount
最大Ngram分值算法:MaxNgramScore
9、分词效果评估
运行项目根目录下的脚本evaluation.bat可以对分词效果进行评估
评估采用的测试文本有253 3709行,共2837 4490个字符
评估结果位于target/evaluation目录下:
corpus-text.txt为分好词的人工标注文本,词之间以空格分隔
test-text.txt为测试文本,是把corpus-text.txt以标点符号分隔为多行的结果
standard-text.txt为测试文本对应的人工标注文本,作为分词是否正确的标准
reSUlt-text-***.txt,***为各种分词算法名称,这是Word分词结果
perfect-reSUlt-***.txt,***为各种分词算法名称,这是分词结果和人工标注标准完全一致的文本
wrong-reSUlt-***.txt,***为各种分词算法名称,这是分词结果和人工标注标准不一致的文本
2
回答
2020-12-21
浏览:11
分类:办公入门
回答:1.创建带有格式的Word文档,将该需要动态展示的数据使用变量符替换。 2. 将刚刚创建的Word文档另存为xml格式。3.编辑这个XMl文档去掉多余的xml标记,如图中蓝色部分 4.从Freemarker官网【下载】最新的开发包,将freemarker.jar拷贝到自己的开发项目中。 5.新建DocUtil类,实现根据Doc模板生成Word文件的方法 6.用户根据自己的需要,调用使用getDataMap获取需要传递的变量,然后调用createDoc方法生成所需要的文档。
2
回答
回答:安卓系统的打开方式是由应用程序注册的,例如像WPS会注册doc、txt等文件类型的打开方式。像开卷有益、ireader等阅读软件会注册txt的打开方式。
当有多个程序都注册同一个文件类型打开方式时,就会出现应用程序的选择框,让用户来选择一个适合的来打开。例如你手机中同时安装了WPS和小说阅读软件的话,那么打开txt时会出现文件选择框,以允许用户选择一个更喜欢的软件打开,另外一般情况下还有一个选项,允许你选择为默认打开方式。
如果用户曾经选择了默认打开方式以后,想更换默认软件的话,可以进入设置—应用程序,找到你设置为默认的那个应用程序,点击"清除默认设置"即可。
综合以上,如果想让手机其它软件打开txt的话,做法如下:
1.
必须安装两个以上的能够打开txt文件的软件。即除了WPS外,还需要安装另外一个能够打开txt文件的程序
2.
如果有两个以上能够打开txt文件的程序,只需要在下次打开txt时,选择除WPS以外的程序即可。
3.
如果有两个以上的能够打开txt文件的程序,但系统未提示选择使用哪个程序打开,而是直接使用WPS打开的话,可以到设置界面的应用程序中找到WPS,点击其中的“清除默认设置”即可。
0
回答
2021-03-01
浏览:0
分类:办公入门
2
回答
2020-12-17
浏览:3
分类:办公入门
回答:
1、你这个问题描述的还是不太清楚的,如果需要在文件夹里面建立文件夹,只要右键新建就可以了
取名Word这样就有了一个叫Word的文件夹
2、如果是需要建立Word文件,还是右键--新建--Microsoft Word 文档就可以了,前提是你电脑上需要安装了office套件或者WPS才可以。
2
回答
2020-11-28
浏览:6
分类:绘图建模
回答:boolean又叫布尔型。是一种数据类型。其取值只能是true或者false。
如:
boolean flag=true;
或者
boolean flag=false;
高深一点的就boolean 函数(){}