自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

phynikesi的博客

随想,小创意,思考,尝试,总结,记录点滴的思绪,收获成长的快乐!

  • 博客(18)
  • 资源 (10)
  • 收藏
  • 关注

原创 RASA2踩坑实录(action、form、story:条件控制与流程跳转)

rasa2使用经验

2022-06-24 14:17:38 1167 4

原创 深度学习模型训练的一般方法(以DSSM为例)

本文主要记录DSSM模型学习期间遇到的问题及结局方案,在此基础上总结了深度学习模型训练的一般思路,对小白有些意义,欢迎各路大神指教。

2020-07-29 23:19:03 1776 5

原创 个人笔记,包括常用工具、网站、资料等

杂记

2024-10-11 15:03:18 104

原创 jupyter notebook 踩坑(win平台、添加kernel、dll缺失)

win平台、添加kernel、处理dll缺失,ipywidgets缺失

2022-07-28 16:10:33 464

转载 module ‘cached_path‘ has no attribute ‘file_friendly_logging‘

使用allennlp 加载elmo报错,AttributeError: module 'cached_path' has no attribute 'file_friendly_logging'

2022-06-29 10:17:05 499 1

原创 flask笔记

适用于python的简易服务框架FLASK,flask也能支撑复杂业务,使用简便,我个人一般用其搭建简易服务,整理部分常用功能作为笔记。导入包from flask import Flask, requestfrom flask import jsonifyimport _thread # 非必须基本设置# 以当前文件为app的根app = Flask(__name__)# 类似json中的ensure_ascii=True,可以直接传输中文字符,不会变为字节码app.con

2021-05-25 09:41:03 219

原创 Hugging Face之ckip实体识别标注体系整理

ckip-ner实体标注及示例CARDINAL -- 数字 【'九百多', '8000', '八百','1111.01'】DATE -- 大粒度时间,时间段 【 '今年', '明天', '今天', '国庆期间', '3天', '10天', '三年前'】EVENT -- 事件 【'伦敦奥运会', '世界杯','第14届中国国际工业博览会', '深圳市五届人大二次会议'】FAC -- 小地点 【'轻轨1号线锡北运河站', '万达广场', '乐购超市','永盛大酒店', '110岗亭'】GPE

2021-04-20 19:49:18 863 1

原创 停车统计方案

小区出入车统计方案1, 先按日期将数据分组,每天一个组,理解成每天的数据是一个文件, daily_data2, 对每天的数据建立入车字典和出车字典,以车牌为key,value为长度24的列表,对应每个小时的最晚入车时间或出车时间。同一车辆不会连续入车两次,也不会连续出车两次,此前必包含完整的进出,可抵消不计,只记录单位小时的最晚入车或出车。列表内的元素为出/入车时间(字符串)或0(这个小时没有出入记录)。3,对当天数据统计每个车的最早出车和最晚入车时间, 有则记录时间,无则记录0。.

2021-04-20 11:44:33 756

原创 Pandas常用功能笔记

pandas包导入import pandas as pd单个sheet处理# 读取excel数据file = './aa.xlsx'data_1 = pd.read_excel(file)data_1.to_excel(file_save, index=False, header=False)# 写入excel数据file_save = './bb.xlsx'sample_1 = [(1, 2), (3, 4), (5, 6)]data_2 = pd.Data_Frame(s

2021-03-29 09:45:29 136 4

原创 TensorFlow之saved_model使用笔记

signature设置x1 = tf.placeholder(tf.int32, shape=[None, None], name='x1')x2 = tf.placeholder(tf.int32, shape=[None, None], name='x2')……y = output_tensorloss = loss_tensorinputs = { 'x1': tf.saved_model.utils.build_tensor_info(x1),

2021-03-08 09:47:55 726 2

原创 tf.sequence_mask与tf.expand_dims

tf.sequence_mask()函数sequence_mask( lengths, # 掩码的长度序列,内部元素为整数 maxlen=None, # 返回数据的最内层数据维度,整数 dtype=tf.bool, # 数据类型,默认为布尔型 name=None # 操作的命名示例:a = tf.sequence_mask(3, dtype=tf.float32)out: [1, 1, 1]# maxlen默认为l.

2021-02-22 11:07:49 223 2

原创 文本摘要之Textrank优化方案

当前文本摘要的处理方式主要分为两类:抽取式和生成式。 抽取式文本摘要:即从篇章中抽取能够代表核心意思的信息,或者抽取关键词再连句,或者抽取完整句子。一般情况下,由词直接连成的句子,往往比较生硬,不够通顺,抽取的句子句义连贯,能比较有效的代表篇章信息。生成的方法理论上可以兼顾关键词信息和句子的自然属性,如通顺,连贯。抽取式文本摘要代表:TextRank方法,利用文章内部的联系计算出重要的词或句子。生成式文本摘要代表:Seq2eq +Attention,借助深度学习方法学习文章主要...

2021-01-10 12:33:41 1655

原创 TF之saved-model踩坑,多次保存模型必看

目录前言正文总结前言近期使用了Tensorflow的saved_model模块,踩过一些坑,总结分享一下。参考了很多资料,部分代码也是照搬,事先说明一下,谢谢各位大佬分享的资料。时间长的同学可以从头看,时间短的同学可以跳转文末看总结。正文Saved_model模块用于保存加载模型,一般配合TensorFlow Serving使用。TF Serving是一个将训练好的模型部署至生产环境的系统,主要的优点在于可以保持Server端与API不变的情况下,部署新的算法或进行

2021-01-08 10:59:32 9409 2

原创 .bat和.sh命令一条命令分行写

.bat命令换行Windows批处理命令文件为xx.bat,换行需在当前行后使用“^”。符号需置于上一行末尾,加到下一行没用。eg:python tf_flags.py --a_bool=False ^--b_float=1.0 --c_int=2 --d_str=pp效果:这是在cmd窗口的截图,可以看达到,实际执行时,命令又被“还原”为同一行了。.sh命令换行Linux脚本命令文件为xx.sh,换行需要在当前行后用“\”。同样的,符号加在上一行的末尾就好。eg:

2020-12-29 20:16:33 9533 2

原创 scikit-learn.metrics的multiclass-multioutput报错解决

错误记录使用scikit-learn.metrics 计算Presion、Accuracy、Recall和F1值,评估模型性能,报错“ValueError: multiclass-multioutput is not supported”。实际数据y_true=[[0,0,0,1],[0,0,1,0]],y_pred=[[0,0,0,1],[0,1,0,0]]。原因,数据没有问题,版本差异,在scikit-learn==0.20.4上面出错,更新为scikit-learn==0.22.2以上即可

2020-11-11 20:30:35 1608 1

原创 结合词性标注的NER(命名实体识别)方案设计

NER(Named Entity Recognition)即命名实体识别,是指识别文本中具有特定意义的实体,如人物、地点、组织、时间和数字等,属于信息抽取的一部分。目前,NER主要在多轮对话项目中应用,用于自动获取词槽所需的实体信息。如:“我想订一张下周一从北京回上海的机票”。在这个例子中按顺序抽取,依次可得<[数字:一],[时间:下周一],[地点:北京],[地点:上海],[订单:机票]>,这些信息并非直接可用,还需进行一定的转换,变为规范数据才能使用。数字通常要转为阿拉伯数字[0-

2020-11-11 20:27:17 1645 6

原创 全节点覆盖路径选择的两种方式

前言:近日帮同学处理了一下数学建模里面的问题,涉及到路径选择,由此产生了两个想法,在此记录一下。问题简述:给定12个城市,给出每个城市的网络容量C和任意两个城市的距离D,由此可求出任意两个城市的网络通信价值V。以城市(名)为节点,网络通信价值V为权重,可得网络通信价值图。要求找出16条路径,需满足两个约束:1,这16条路径需包含所有城市(节点);2,在满足条件1 的同时要求这些路径的通信价值和...

2020-08-28 10:56:50 409

原创 调用百度地图API报错‘211’ sn 校验失败

近日在Python 3.6中尝试了一下百度地图API,遇到一些问题,已经解决,在此记录,希望能给同惑者带来帮助。先说问题:1,尝试百度地图API的sn计算示例,遇到错误——{'status': 240, 'message': 'APP 服务被禁用'}2,解决上述问题后,遇到新错误——{'status': 211, 'message': 'APP SN校验失败'}上代码,这是地理编码...

2019-07-12 21:37:47 4390 1

pypi_kenlm-0.1.20210121-cp39-cp39-win_amd64.whl

无需复杂的配置过程,一键安装pypi_kenlm,适用于Python3.9

2022-01-13

pypi_kenlm-0.1.20210121-cp38-cp38-win_amd64.whl

无需复杂的配置过程,一键安装pypi_kenlm,适用于Python3.8

2022-01-13

pypi_kenlm-0.1.20210121-cp37-cp37m-win_amd64.whl

无需复杂的配置过程,一键安装pypi_kenlm,适用于Python3.7

2022-01-13

pypi_kenlm-0.1.20210121-cp36-cp36m-win_amd64.whl

无需复杂的配置过程,一键安装pypi_kenlm,适用于Python3.6

2022-01-13

GitHub下载加速.zip

github下载加速插件,Chrome浏览器专用,包括插件伴侣和Github_speed_1_0_8_0.crx

2021-10-22

数理统计matlab实用练习

内含茎叶图、累积频数图、频数、频率输出函数文件、卡方分布文件、经验函数图等文件的代码,附有注释

2018-10-17

数值分析每章编程题(matlab实现)

主要包含数值分析第二章至第七章课后编程实践。全部采用matlab实现,内附详细代码及注释,即可作为作业资料,也可作为matlab编程练习,同时包含丰富的图像,以便观察理解。

2018-10-08

数值分析第5版课后习题答案

包含数值分析课后习题全部答案,按章节排列目录,内容详实,顺序清晰。方便阅读查找。

2018-10-08

数理统计实验练习-大作业-matlab练习

这是研一数理统计大作业的实现全过程,包含一部分数据,数据可替换。以该数据为基础,使用整个数理统计课程中学习的技术来处理它。包含数据采集,数据预处理,模型选择,参数估计,经验分布函数绘制等过程。此外,还收集了一些常见模型,自己写了一些实用小函数。

2018-10-08

python 欧几里得距离练习实例

Python 机器学习 欧几里得距离

2017-07-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除