- 博客(18)
- 资源 (10)
- 收藏
- 关注
原创 深度学习模型训练的一般方法(以DSSM为例)
本文主要记录DSSM模型学习期间遇到的问题及结局方案,在此基础上总结了深度学习模型训练的一般思路,对小白有些意义,欢迎各路大神指教。
2020-07-29 23:19:03 1776 5
原创 jupyter notebook 踩坑(win平台、添加kernel、dll缺失)
win平台、添加kernel、处理dll缺失,ipywidgets缺失
2022-07-28 16:10:33 464
转载 module ‘cached_path‘ has no attribute ‘file_friendly_logging‘
使用allennlp 加载elmo报错,AttributeError: module 'cached_path' has no attribute 'file_friendly_logging'
2022-06-29 10:17:05 499 1
原创 flask笔记
适用于python的简易服务框架FLASK,flask也能支撑复杂业务,使用简便,我个人一般用其搭建简易服务,整理部分常用功能作为笔记。导入包from flask import Flask, requestfrom flask import jsonifyimport _thread # 非必须基本设置# 以当前文件为app的根app = Flask(__name__)# 类似json中的ensure_ascii=True,可以直接传输中文字符,不会变为字节码app.con
2021-05-25 09:41:03 219
原创 Hugging Face之ckip实体识别标注体系整理
ckip-ner实体标注及示例CARDINAL -- 数字 【'九百多', '8000', '八百','1111.01'】DATE -- 大粒度时间,时间段 【 '今年', '明天', '今天', '国庆期间', '3天', '10天', '三年前'】EVENT -- 事件 【'伦敦奥运会', '世界杯','第14届中国国际工业博览会', '深圳市五届人大二次会议'】FAC -- 小地点 【'轻轨1号线锡北运河站', '万达广场', '乐购超市','永盛大酒店', '110岗亭'】GPE
2021-04-20 19:49:18 863 1
原创 停车统计方案
小区出入车统计方案1, 先按日期将数据分组,每天一个组,理解成每天的数据是一个文件, daily_data2, 对每天的数据建立入车字典和出车字典,以车牌为key,value为长度24的列表,对应每个小时的最晚入车时间或出车时间。同一车辆不会连续入车两次,也不会连续出车两次,此前必包含完整的进出,可抵消不计,只记录单位小时的最晚入车或出车。列表内的元素为出/入车时间(字符串)或0(这个小时没有出入记录)。3,对当天数据统计每个车的最早出车和最晚入车时间, 有则记录时间,无则记录0。.
2021-04-20 11:44:33 756
原创 Pandas常用功能笔记
pandas包导入import pandas as pd单个sheet处理# 读取excel数据file = './aa.xlsx'data_1 = pd.read_excel(file)data_1.to_excel(file_save, index=False, header=False)# 写入excel数据file_save = './bb.xlsx'sample_1 = [(1, 2), (3, 4), (5, 6)]data_2 = pd.Data_Frame(s
2021-03-29 09:45:29 136 4
原创 TensorFlow之saved_model使用笔记
signature设置x1 = tf.placeholder(tf.int32, shape=[None, None], name='x1')x2 = tf.placeholder(tf.int32, shape=[None, None], name='x2')……y = output_tensorloss = loss_tensorinputs = { 'x1': tf.saved_model.utils.build_tensor_info(x1),
2021-03-08 09:47:55 726 2
原创 tf.sequence_mask与tf.expand_dims
tf.sequence_mask()函数sequence_mask( lengths, # 掩码的长度序列,内部元素为整数 maxlen=None, # 返回数据的最内层数据维度,整数 dtype=tf.bool, # 数据类型,默认为布尔型 name=None # 操作的命名示例:a = tf.sequence_mask(3, dtype=tf.float32)out: [1, 1, 1]# maxlen默认为l.
2021-02-22 11:07:49 223 2
原创 文本摘要之Textrank优化方案
当前文本摘要的处理方式主要分为两类:抽取式和生成式。 抽取式文本摘要:即从篇章中抽取能够代表核心意思的信息,或者抽取关键词再连句,或者抽取完整句子。一般情况下,由词直接连成的句子,往往比较生硬,不够通顺,抽取的句子句义连贯,能比较有效的代表篇章信息。生成的方法理论上可以兼顾关键词信息和句子的自然属性,如通顺,连贯。抽取式文本摘要代表:TextRank方法,利用文章内部的联系计算出重要的词或句子。生成式文本摘要代表:Seq2eq +Attention,借助深度学习方法学习文章主要...
2021-01-10 12:33:41 1655
原创 TF之saved-model踩坑,多次保存模型必看
目录前言正文总结前言近期使用了Tensorflow的saved_model模块,踩过一些坑,总结分享一下。参考了很多资料,部分代码也是照搬,事先说明一下,谢谢各位大佬分享的资料。时间长的同学可以从头看,时间短的同学可以跳转文末看总结。正文Saved_model模块用于保存加载模型,一般配合TensorFlow Serving使用。TF Serving是一个将训练好的模型部署至生产环境的系统,主要的优点在于可以保持Server端与API不变的情况下,部署新的算法或进行
2021-01-08 10:59:32 9409 2
原创 .bat和.sh命令一条命令分行写
.bat命令换行Windows批处理命令文件为xx.bat,换行需在当前行后使用“^”。符号需置于上一行末尾,加到下一行没用。eg:python tf_flags.py --a_bool=False ^--b_float=1.0 --c_int=2 --d_str=pp效果:这是在cmd窗口的截图,可以看达到,实际执行时,命令又被“还原”为同一行了。.sh命令换行Linux脚本命令文件为xx.sh,换行需要在当前行后用“\”。同样的,符号加在上一行的末尾就好。eg:
2020-12-29 20:16:33 9533 2
原创 scikit-learn.metrics的multiclass-multioutput报错解决
错误记录使用scikit-learn.metrics 计算Presion、Accuracy、Recall和F1值,评估模型性能,报错“ValueError: multiclass-multioutput is not supported”。实际数据y_true=[[0,0,0,1],[0,0,1,0]],y_pred=[[0,0,0,1],[0,1,0,0]]。原因,数据没有问题,版本差异,在scikit-learn==0.20.4上面出错,更新为scikit-learn==0.22.2以上即可
2020-11-11 20:30:35 1608 1
原创 结合词性标注的NER(命名实体识别)方案设计
NER(Named Entity Recognition)即命名实体识别,是指识别文本中具有特定意义的实体,如人物、地点、组织、时间和数字等,属于信息抽取的一部分。目前,NER主要在多轮对话项目中应用,用于自动获取词槽所需的实体信息。如:“我想订一张下周一从北京回上海的机票”。在这个例子中按顺序抽取,依次可得<[数字:一],[时间:下周一],[地点:北京],[地点:上海],[订单:机票]>,这些信息并非直接可用,还需进行一定的转换,变为规范数据才能使用。数字通常要转为阿拉伯数字[0-
2020-11-11 20:27:17 1645 6
原创 全节点覆盖路径选择的两种方式
前言:近日帮同学处理了一下数学建模里面的问题,涉及到路径选择,由此产生了两个想法,在此记录一下。问题简述:给定12个城市,给出每个城市的网络容量C和任意两个城市的距离D,由此可求出任意两个城市的网络通信价值V。以城市(名)为节点,网络通信价值V为权重,可得网络通信价值图。要求找出16条路径,需满足两个约束:1,这16条路径需包含所有城市(节点);2,在满足条件1 的同时要求这些路径的通信价值和...
2020-08-28 10:56:50 409
原创 调用百度地图API报错‘211’ sn 校验失败
近日在Python 3.6中尝试了一下百度地图API,遇到一些问题,已经解决,在此记录,希望能给同惑者带来帮助。先说问题:1,尝试百度地图API的sn计算示例,遇到错误——{'status': 240, 'message': 'APP 服务被禁用'}2,解决上述问题后,遇到新错误——{'status': 211, 'message': 'APP SN校验失败'}上代码,这是地理编码...
2019-07-12 21:37:47 4390 1
数值分析每章编程题(matlab实现)
2018-10-08
数理统计实验练习-大作业-matlab练习
2018-10-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人