自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (10)
  • 收藏
  • 关注

原创 Logging 日志输出 - 按天分割 - 无双重输出问题 - 可多个py文件 - 不适用多进程情况

Logging 多个py文件一个log文件,无双重输出。python。

2024-04-12 17:55:57 414

原创 Ubuntu安装Anaconda并创建虚拟环境

ubuntu anaconda 虚拟环境 pip

2024-01-08 16:17:06 648

原创 TypeError: POST data should be bytes, an iterable of bytes, or a file object. It cannot be of type s

python, 编码, 类别错误, typeerror

2024-01-06 09:48:48 375

原创 numpy 3维0数据

python, numpy, 3维, 0数组

2023-12-11 13:53:10 51

原创 Rasa Multi-worker

1. $ conda activate myvirtualenv2. $ conda env config vars set ACTION_SERVER_SANIC_WORKERS=5To make your changes take effect please reactivate your environment3. $ conda env config vars set SANIC_WORKERS=5To make your changes take effect please reactiva

2023-12-05 16:58:47 196

原创 Neo4j在Ubuntu 20.04上安装、配置以及Python连接使用 - Neo4j

安装 neo4j ubuntu 20.04

2023-10-19 15:59:22 1361

转载 训练 vs 推理

训练和推理有何不同

2022-09-16 09:51:50 1738

原创 Windows10(Win10)环境变量位置 / 打开方式

环境变量, windows10, win10

2022-09-03 09:39:40 311

原创 Windows11(Win11)环境变量位置 / 打开方式

windows 11 win11 环境变量位置

2022-08-28 17:48:23 334

原创 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa1 in position 20: illegal multibyte sequence

Unicode

2021-12-23 14:46:24 687

原创 OR in Rasa Story(Rasa 故事中的 OR 问题)

OR:1. 目标:合并,重用Story的主体2.用法:除了OR两边的在特定对话状态下可能出现的意图外,其余部分均相同,从而通过OR在一个Story中实现两个会话:3.总结:好处是在使用时 OR无具体的数目限制;缺点如同Checkpoints,过度使用会在训练过程中引发内存问题。同时也可将其视为 NLU数据中某些意图可以进行合并的指标。...

2021-03-23 16:07:43 395

原创 Checkpoint in Rasa Story(Rasa 故事中的 Checkpoint 问题)

Checkpoint:1. 目标模块化,重用部分会话。2. 用法在要重用的部分会话的后边添加“>checkpoint_name”,例如:然后,就可以在其他 Story 中通过checkpoint_name(即“check_asked_question”)重用此部分会话:3. 问题使用 Checkpoint,虽然省事,但会很快导致严重的内存问题且可读性差,因而切记非万不得已勿用!...

2021-03-23 11:15:38 394

原创 UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xc3 in position 1895538: ordinal not in range(1

Failure:UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 1895538: ordinal not in range(128).Analyze:pip installed.Solution:From site-packages, find the related .py file, and replace 'ascii' with 'utf-8'.

2020-08-11 11:29:27 244

原创 PyTorch -- RuntimeError:

Failure:Concurrent:1.RuntimeError: Caught RuntimeError in replica 0 on device 0.2.RuntimeError: CUDA out of memory. Tried to allocate 12.00 MiB (GPU 0; 10.73 GiB total capacity; 1.36 GiB already allocated; 11.31 MiB free; 66.94 MiB cached)...

2020-05-29 19:48:00 2708

原创 PyTorch -- AssertionError:

Failure:AssertionError:The NVIDIA driver on your system is too old (found version 10010).Please update your GPU driver by downloading and installing a newversion from the URL: http://www.nvidia.com/Download/index.aspxAlternatively, go to: https://.

2020-05-29 19:11:49 2188

原创 NLTK -- LookupError: Resource punkt not found.

Failure:LookupError:********************************************************************** Resource punkt not found. Please use the NLTK Downloader to obtain the resource: >>> import nltk >>> nltk.download('punkt') Fo...

2020-05-29 19:03:35 1762 3

原创 机器翻译中的古汉语现代汉语句子对齐研究

第十一届全国机器翻译研讨会(CWMT 2015)                                                                中国 · 合肥 2015.9.24-25汉语古现句子对齐研究李文句子对齐机器翻译摘要:古代汉语与现代汉语对齐方法,其中融入了新的特征,同时去掉了较常用的句长特征。通过句内

2017-11-20 18:18:43 2468 1

原创 DISK_ONLY 实现

于 pyspark (spark python) 中实现 DISK_ONLY:.persist(StorageLevel.DISK_ONLY)

2017-01-15 18:06:24 677

原创 Total size of serialized results of 20 tasks (1088.8 MB) is bigger than spark.driver.maxResultSize (

Total size of serialized results of 20 tasks (1088.8 MB) is bigger thanspark.driver.maxResultSize (1024.0 MB)pypark 2.0 (spark python)  执行中出现上述错误,解决方案:SparkContext.setSystemProperty('spark.driver.

2017-01-15 17:54:03 8561

转载 [转]python 如何在一个for循环中遍历两个列表

是我在看《笨方法学python》过程中发现有一行代码看不懂——“ for sentence in snippet, phrase:”,所以研究了半天,感觉挺有收获的。所以就放在博客上分享给大家了。直入主题:为了不耽误大家时间,如果知道以下为两段代码为什么输出不一样的话我觉得您肯定知道我下面要说的是什么了,您就不必花时间再读下去了。1和2两段代码的区别是print在for循环

2017-01-13 10:56:34 4076

转载 [转]Python MySQLdb在Linux下的快速安装

在家里windows环境下搞了一次见   python MySQLdb在windows环境下的快速安装、问题解决方式http://blog.csdn.net/wklken/article/details/7253245在公司开发需要,再搞一次,linux下的。发现用编译的方式安装真的很蛋疼,不过也算见见世面,各种问题......

2016-12-22 17:29:06 366

原创 Spark英中对照翻译(PySpark中文版新手快速入门-Quick Start)-中文指南,教程(Python版)-20161115

Spark 中文翻译教程PySpark 指南Quick Start快速入门交互式分析基本知识RDD

2016-11-15 13:26:49 6386

原创 Windows 7 下 Ubuntu Kylin 16.04 LTS 双系统的安装

一. 压缩卷:目的是为 Ubuntu 所用。先确定要压缩的现有盘。一般是空闲空间较大的分区。依次打开“计算机”-“管理”-“磁盘管理”。从下面显示的方框中,在要压缩的分区所在的方框内单击右键,在右键菜单中选择“压缩卷”。在“压缩空间量”中,修改相应的数字,我压缩了 100G,即 100000M。后续步骤中,把“新加卷”改为“Ubuntu”。完成压缩步骤后,打开“计算机”

2016-05-11 14:37:24 3686

原创 安装过 python3.X 后,python 2.7.x 打不开 idle

安装过 python3.X 后,python 2.7.x 打不开 idle

2016-05-09 12:56:13 1149

转载 最大熵原理

在投资时常常讲不要把所有的鸡蛋放在一个篮子里,这样可以降低风险。在信息处理中,这个原理同样适用。在数学上,这个原理称为最大熵原理(the maximum entropy principle)。最大熵原理 是在 1957  年由 E.T.Jaynes  提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。因为在这种情况下,符合已知知识的概率分布可能不

2016-02-20 11:52:11 1386

文章关键词提取工具

提取文章中的关键词,按词频提取,排序顺序是按词频高低。

2016-07-07

重复行(或重复词语)删除程序 (Python 代码)

可以删除文档中重复的内容,只要是一行一行的,包括词表中重复的词、术语、词组或短语等,以及文章中重复的词、词组、短语、句子、段落等。在 .txt 中操作。

2016-06-03

MySQL 数据库操作程序(Python 代码)

通过 MySQLdb 和 Python 代码来实现 MySQL 数据库的一些基本操作。

2016-02-25

MySQL 数据库创建(Python 代码)

用 Python 和 MySQLdb 创建 MySQL 数据库,可以根据自己的需要再添加字段和按需赋值。

2016-02-25

MySQL 数据库操作和使用程序(Python 代码实现)

通过 MySQLdb 和 Python 代码来实现 MySQL 数据库的一些基本操作。

2016-02-25

重复行删除程序 (Python 代码)

可以删除文档中重复的内容,只要是一行一行的,包括词表中重复的词、词组或短语等,以及文章中重复的词、词组、短语、句子、段落等。在 .txt 中操作。

2016-02-18

有关词性标注的一点意见

如果翻阅整个词典,肯定会发现不少问题。但是正如吕叔湘先生生前所指出的,“做总比不做好。万事开头难,只要开了头,随着科学的发展和研究的深入,总有一天会完备起来的”。因此在汉语中型词典里给词标注词性,应当充分肯定。

2016-02-18

基于条件随机场_CRFs_的中文词性标注方法

本文提出一种基于 CRFs 模型的中文词性标注方法。该方法利用 CRFs 模型能够添加任意特征的优点 ,在使用词的上下文信息的同时 ,针对兼类词和未登录词添加了新 ...

2016-02-18

中文核心刊物列表

中文核心刊物列表 CSSCI。包括扩展的刊物,清华大学实行的。

2016-02-18

支持向量机SVM和核函数的matlab程序集

支持向量机SVM和核函数的matlab程序集

2014-04-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除