中文、日文等宽字体

XP自带的等宽字体:
BatangChe Courier "Courier New" DotumChe Fixedsys GulimChe GungsuhChe
"Lucida Console" "Lucida Sans Typewriter" MingLiU "MS Gothic" "MS Mincho"
Terminal  仿宋_GB2312 楷体_GB2312 隶书 宋体-方正超大字符集 新宋体 幼圆

XP自带的可显示中文,日文文字的等宽字体(除了中文名称的字体):(推荐前三种)
"Courier New" "Lucida Sans Typewriter"  GulimChe MingLiU 
BatangChe Courier "DotumChe" GungsuhChe "Lucida Console"
"MS Gothic"

XP自带的可显示中文,日文文字的非等宽字体:
SimSun Mangal Arial
"Book Antiqua" "Bookman Old Style" "Calisto MT" Century
Georgia Latha "Lucida Sans" "Maiandra GD"
"Microsoft Sans Serif" "MS Reference Sans Serif" Tahoma
"Times New Roman" "Trebuchet MS" Verdana
Sylfaen

等宽字体推荐(需安装):
"Bitstream Vera Sans Mono", "andale mono", Dina, "Vera Sans YuanTi Mono"
"andale mono" 下载地址:
http://sourceforge.net/project/showfiles.php?group_id=34153&release_id=105355

HTML上常用字体:
Times New Roman, Times,sans-serif, Arial, Tahoma, Courier,
Verdana,Book Antiqua, Webdings
 
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Tesseract是一个开源的光学字符识别引擎,用于将印刷体文本转换成可编辑或可搜索的电子文档。原本Tesseract只支持英文字母的识别,但是经过后续的改进,它现在也可以同时识别中文日文。 要让Tesseract能够同时识别中文日文,首先需要安装适当的语言数据文件。对于中文,可以下载和安装chi_sim.traineddata文件;对于日文,可以下载和安装jpn.traineddata文件。这些训练数据包含了用于识别相应语言的字符和模式。 安装完语言数据文件后,就可以使用Tesseract进行中文日文文本的识别了。用户可以通过命令行或API调用Tesseract,并指定识别的语言。例如,使用命令行可以输入以下命令: tesseract image.png output -l chi_sim+jpn 这个命令将读取名为image.png的图片,并将识别结果保存到output.txt文件中。参数-l表示指定识别的语言,chi_sim代表中文,jpn代表日文。通过同时指定这两个参数,Tesseract可以同时识别中文日文。 除了使用命令行,还可以使用Tesseract的API进行中文日文识别。开发人员可以根据需要编写相应的代码,调用Tesseract的函数,并将待识别的图像和识别语言作为参数传递给它。然后,Tesseract会返回识别结果,供开发人员后续处理或展示。 总之,Tesseract通过安装相应的语言数据文件,可以同时识别中文日文。无论是通过命令行还是API调用,用户都可以方便地利用Tesseract进行多语言文本的光学字符识别。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值