蒙古文信息处理
Oyvnbilig
喜欢蒙古文信息处理,有交流蒙古文信息处理的朋友联系我1499273536@qq.com
展开
-
Word--Python-docx操作蒙古文等复杂文种更换字体
蒙古文办公自动化操作,word中如何设置蒙古文字体原创 2022-07-04 14:22:28 · 526 阅读 · 1 评论 -
writing_mode:vertical-lr和flex-direction布局以及蒙古文展示
蒙古文是从上到下,从左到右书写的,所以一般布局中,div布局要横向排列。这时我一般都是父div为flex-direction:row .category_1{ background: blueviolet; } .category_2{ background: #fd0101; } .detail{ display: inline-block; } .flex_test{ display: f原创 2021-12-12 15:57:24 · 1288 阅读 · 0 评论 -
Python如何删除多余的空格与空行
https://blog.csdn.net/lurrass/article/details/102524767 这种情况在蒙古文信息处理里经常遇见。 holvoo网爬虫中title部分是倒序的,可能是因为转动蒙古文字体的原因。 <span class="title"> list2 <br/> list1 </span> title_list = html.xpath('//*[@class="title"]/text()').extract() title_l.原创 2021-12-06 11:50:44 · 874 阅读 · 0 评论 -
正则表达式匹配指定匹配后面的匹配
在线正则匹配工具 正则匹配教程,可以看此教程 以下列出 ?=、?<=、?!、?<! 的使用区别 字符串 : http://www.holvoo.net/article/articleView.do?id=08541b8a-fe1d-42bc-839d-d0e8250d21ac 正则表达式 :(?<=(.*?id=)).* ...原创 2021-12-05 16:34:06 · 530 阅读 · 0 评论 -
‘utf-8‘ codec can‘t decode byte 0xff in position 0: invalid start byte
通过记事本另存为 utf带bom格式 在读入蒙古文文件时经常遇见这种错误原创 2021-11-29 19:32:27 · 175 阅读 · 0 评论 -
Scrapy爬虫步骤
项目创建 项目名字为 mgyxw,在自己任何目录下都可以 指令为 scrapy startproject mgyxw1 建立spider 根据命令行提示 建立我的spider news 指令为 cd mgyxw1 scrapy genspider news mgyxw.cn 建立爬虫执行入口 from scrapy import cmdline cmdline.execute("scrapy crawl mgyxw1".split()) ...原创 2021-11-20 16:03:16 · 451 阅读 · 0 评论 -
渲染HTML中的字符串并保留空格和换行符
从数据库渲染到前端HTML时默认情况下很多字符包含换行符\u000d\u000a是不会被渲染的,被浏览器直接显示为多个 /内码为\u0020\u000d\u000a\u000d\u000a\u0026\u0023\u0031\u0036\u0030\u003b(可能不准确)。 对此情况 网上找到遇见跟我一样问题的帖子 https://www.imooc.com/wenda/detail/597381 解决方法 div{ white-space: pre-wrap; } 我测试原创 2021-11-18 19:25:02 · 1296 阅读 · 0 评论