小创意
文章平均质量分 71
phynikesi
主要从事NLP研究与工作,对算法和一些新奇的创意感兴趣,喜欢但不限于IT行业的有趣现象
展开
-
停车统计方案
小区出入车统计方案1, 先按日期将数据分组,每天一个组,理解成每天的数据是一个文件, daily_data2, 对每天的数据建立入车字典和出车字典,以车牌为key,value为长度24的列表,对应每个小时的最晚入车时间或出车时间。同一车辆不会连续入车两次,也不会连续出车两次,此前必包含完整的进出,可抵消不计,只记录单位小时的最晚入车或出车。列表内的元素为出/入车时间(字符串)或0(这个小时没有出入记录)。3,对当天数据统计每个车的最早出车和最晚入车时间, 有则记录时间,无则记录0。.原创 2021-04-20 11:44:33 · 668 阅读 · 0 评论 -
文本摘要之Textrank优化方案
当前文本摘要的处理方式主要分为两类:抽取式和生成式。 抽取式文本摘要:即从篇章中抽取能够代表核心意思的信息,或者抽取关键词再连句,或者抽取完整句子。一般情况下,由词直接连成的句子,往往比较生硬,不够通顺,抽取的句子句义连贯,能比较有效的代表篇章信息。生成的方法理论上可以兼顾关键词信息和句子的自然属性,如通顺,连贯。抽取式文本摘要代表:TextRank方法,利用文章内部的联系计算出重要的词或句子。生成式文本摘要代表:Seq2eq +Attention,借助深度学习方法学习文章主要...原创 2021-01-10 12:33:41 · 1593 阅读 · 0 评论 -
结合词性标注的NER(命名实体识别)方案设计
NER(Named Entity Recognition)即命名实体识别,是指识别文本中具有特定意义的实体,如人物、地点、组织、时间和数字等,属于信息抽取的一部分。目前,NER主要在多轮对话项目中应用,用于自动获取词槽所需的实体信息。如:“我想订一张下周一从北京回上海的机票”。在这个例子中按顺序抽取,依次可得<[数字:一],[时间:下周一],[地点:北京],[地点:上海],[订单:机票]>,这些信息并非直接可用,还需进行一定的转换,变为规范数据才能使用。数字通常要转为阿拉伯数字[0-原创 2020-11-11 20:27:17 · 1561 阅读 · 6 评论 -
深度学习模型训练的一般方法(以DSSM为例)
本文主要记录DSSM模型学习期间遇到的问题及结局方案,在此基础上总结了深度学习模型训练的一般思路,对小白有些意义,欢迎各路大神指教。原创 2020-07-29 23:19:03 · 1721 阅读 · 5 评论 -
全节点覆盖路径选择的两种方式
前言:近日帮同学处理了一下数学建模里面的问题,涉及到路径选择,由此产生了两个想法,在此记录一下。问题简述:给定12个城市,给出每个城市的网络容量C和任意两个城市的距离D,由此可求出任意两个城市的网络通信价值V。以城市(名)为节点,网络通信价值V为权重,可得网络通信价值图。要求找出16条路径,需满足两个约束:1,这16条路径需包含所有城市(节点);2,在满足条件1 的同时要求这些路径的通信价值和...原创 2020-08-28 10:56:50 · 376 阅读 · 0 评论 -
调用百度地图API报错‘211’ sn 校验失败
近日在Python 3.6中尝试了一下百度地图API,遇到一些问题,已经解决,在此记录,希望能给同惑者带来帮助。先说问题:1,尝试百度地图API的sn计算示例,遇到错误——{'status': 240, 'message': 'APP 服务被禁用'}2,解决上述问题后,遇到新错误——{'status': 211, 'message': 'APP SN校验失败'}上代码,这是地理编码...原创 2019-07-12 21:37:47 · 4133 阅读 · 1 评论