NLP工程
clean_bing
毕业于电子科技大学计算机专业硕士,20年软件研发及管理经验,曾在摩托罗拉、博朗软件等五百强企业担任技术及管理工作。1996年入行编程,负责过操作系统、网络协议、DSP、数字通信系统、对讲机基站、ERP及供应链系统、阿里钉钉SaaS应用、微信小程序、简道云PaaS、工程造价大数据系统、造价文本NLP等各种语言和软件的研发。06年技术转管理,拿到PMP、SCRUM、及乔治华盛顿大学项目管理证书,在团队组建、流程优化、人员激励、科技创新方面有多年实战经验。成都市人工智能及大数据专家库成员,四川大学创新创业导师,电子科技大学计算机学院校外导师。连续创业者,目前在大匠通科技聚焦工程造价大数据及NLP创业
展开
-
22万行文本的短语分割结果应保存为Json还是Txt?
在做一个专业领域的文本探索工程的时候, 不经意间遇到这个问题。分享踩坑过程,最后的结论是 应选择保存为txt文件,自己写txt读取的解析代码,无论是保存还是读取,都要比直接用json格式暂存中间结果,要快得多!多!多! 最开始我 ...原创 2021-03-02 22:20:20 · 148 阅读 · 0 评论 -
[NLP工程项目实战:用NLP解决工程造价文本难题] (1) 开篇及文本特点探索
问题背景 工程造价属于工程行业的一个分支,主要确定一个工程的造价构成,通过算量和计价软件,生成一个工程的详细造价构成。 造价清单,是构成造价的最小元素。一条清单的重要文本包含清单名称、清单特征、套用的N条定额。N条定额中包含详细材料列表。名称(简称A)、特征(简称B)、材料(简称C)被称为清单的三个要素,简称为清单三要素。 一个总造价几个亿的工程,通常由几千条清单构成,造价工程师需要很长的时间来完成这份造价。由于清单数量众多,经常发生清单三要素不一致的人为错误。例如A中写的是“商品混凝土C30”,B中写的却原创 2020-05-19 22:35:11 · 569 阅读 · 1 评论