Python
neu_eddata_yjzhang
-
【Python】Pip/Conda 导出环境并根据.txt安装环境
pip批量导出包含环境中所有组件的requirements.txt文件pip freeze > requirements.txtpip批量安装requirements.txt文件中包含的组件依赖pip install -r requirements.txtconda批量导出包含环境中所有组件的requirements.txt文件conda list -e > requirements.txtconda批量安装requirements.txt文件中包含的组件..原创 2022-03-04 13:31:57 · 1746 阅读 · 0 评论 -
【PYTORCH】RuntimeError: torch.cuda.FloatTensor is not enabled.
这个错误的原因是你在安装了cpu版本的pytorch上运行GPU版本的pytorch的代码。解决方法:将出错位置的".cuda()"换成".cpu()"原创 2021-12-29 15:42:59 · 1530 阅读 · 0 评论 -
【PYTHON】WIN/Ubuntu 查看python位数
一、WIN如果系统安装了Anaconda的话,在开始中找到"Anaconda"并打开"Anaconda Promot(Install)"。如果没有的话则在cmd中输入下文的命令。之后输入下述命令,便可看到python 这表示我的python是64位的。二、Linux打开终端并输入下述命令进入python。python接下来输入下面两行代码就可以看到结果。import platformplatform.architecture()...原创 2021-12-28 10:55:27 · 1578 阅读 · 0 评论 -
【问题记录】json.decoder.JSONDecodeError:Extra data: line xxx column xxx(char xxxx)
这个报错一般都出现在解析的json文件格式不对,有特殊字符或者一次性读取的文件过大。(个人认为第一种情况更有可能,因为我的文件数据量就有十多万条,正常打开也没问题)一开始,我想使用如下命令打开json格式的文件 with open(data_path) as fp_data: raw_problems = json.load(fp_data)但是会保存json解码过程出现错误,Extra data: line 8 column 1(char 190)。这个原创 2021-12-28 10:45:03 · 4411 阅读 · 2 评论 -
【PYTORCH】Pytorch0.4.0安装教程与GPU配置大合集(含测试代码)
1.查看pytorch是否存在以及pytorch的版本import torchprint(torch.__version__)2.查看cuda是否可用print(torch.cuda.is_available())3.查看cuda版本print(torch.version.cuda)4.查看当前工作的GPUprint(torch.cuda.current_device())5.查看gpu的数目print(torch.cuda.device...原创 2021-12-25 20:20:14 · 7896 阅读 · 0 评论 -
【PYTORCH】Expected object of type torch.xxxTensor but found type torch.cuda.xxxTensor(torch0.4.0)
上图是错误的全部内容,其中对我们修改bug有用的部分是从图中我们可以看到,我们所希望的layer(x,mask)的第二个参数”mask“应该为torch.ByteTensor类型而不是现在的torch.cuda.ByteTensor类型。所以我们应该将mask的类型强制转化为torch.ByteTensor。即通过修改mask的type来完成,具体操作如下:layer(x,mask.type(torch.ByteTensor))....原创 2021-12-25 19:58:09 · 758 阅读 · 0 评论 -
【PYTHON】strip()方法、spilt()方法、count()方法
Python strip() 方法用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符Pythonsplit()通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则分隔 num+1 个子字符串下面举例来实现一下text = " 镇海 雅乐 学校 二年级 的 小朋友 到 一条 小路 的 一边 植树 . 小朋友 们 每隔 2 米 种 一棵树 ( 马路 两头 都 种 了 树 ) , 最后 ..原创 2021-12-14 13:42:02 · 1777 阅读 · 0 评论 -
【PYTHON】Python中的re库与正则表达式实例演示(含可执行代码)
其官方文档如下:re — Regular expression operations — Python 3.10.1 documentationsearch() vs. match()Python 提供了两种不同的操作:基于re.match()检查字符串开头,或者re.search()检查字符串的任意位置(默认Perl中的行为)例如:>>> re.match("c", "abcdef") # No match>>> re.search...原创 2021-12-14 13:18:34 · 1097 阅读 · 0 评论 -
【PYLTP】pyltp(SentenceSplitter、Segmentor、Postagger、NamedEntityRecognizer、Parserr)个人理解(含可执行代码)
此博客均为对下面这个文档的复现,非原创!!!!使用 pyltp — pyltp 0.2.0 文档附录 — LTP4 4.1.4 文档1.安装pyltp 首先激活你的虚拟环境,然后输入下面语句即可,如果出现问题的话可以更换为清华源。pip install pyltp然后下载你自己所需要的ltp模型,这里附上3.4.0版本的http://model.scir.yunfutech.com/model/ltp_data_v3.4.0.zip2.使用的简单举例2.1分句..原创 2021-12-14 10:38:10 · 4764 阅读 · 2 评论 -
【Pytorch】Pytorch的PackedSequence()类
其官方文档如下:PackedSequence — PyTorch 1.10.0 documentation其解释为:将一个填充过的变长序列压紧。其参数分别为:data:要压紧的张量batch_sizes:源张量的维度信息。batch_first:是否坚持批次优先实验结果如下:import numpy as npimport torchfrom torch.nn.utils.rnn import pack_padded_sequence,pad_packed_seq.原创 2021-12-13 15:29:44 · 1276 阅读 · 0 评论 -
【Pytorch】利用Pytorch+GRU实现情感分类(附源码)
在这个实验中,数据的预处理过程以及网络的初始化及模型的训练等过程同前文《利用Pytorch+LSTM实现中文新闻分类》,具体这里就不再重复解释了。如果有读者在对数据集的预处理过程中有疑问,请参考我的其他博客,里面对这些方法均有我的一些个人体会,这里直接贴上源码。## 导入本章所需要的模块import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.metrics import accuracy_原创 2021-12-11 10:16:20 · 2798 阅读 · 1 评论 -
【Pytorch】Tensor.repeat()方法
使用张量的.repeat()方法,可以将张量看作一个整体,然后根据指定的形状进行重复填充,得到新的张量。原创 2021-12-09 13:47:55 · 1727 阅读 · 0 评论 -
【SKLEARN】StandardScaler()及其fit_transform()方法
1.StandardScaler()函数,其官方解释如下:中文翻译为:通过删除平均值并缩放到单位方差来标准化特征。样本x的标准分数计算如下:z=(x-u)/s其中,u是训练样本的平均值,如果_mean=False,则为零;如果_std=False,则s是训练样本的标准偏差或一。通过计算训练集中样本的相关统计信息,对每个特征分别进行定心和缩放。然后存储平均值和标准偏差,以便使用transform在以后的数据上使用。数据集的标准化是许多机器学习估计器的共同要求:如果单个特征或多或原创 2021-12-09 12:35:30 · 10492 阅读 · 0 评论 -
【SKLEARN】classification_report函数与confusion_matrix函数
本博客采取的例子为垃圾邮件预测。预测结果(标签)为0或1.1.classification_report()函数:其官方说明文档如下:其中文翻译如下:y_true:1d类数组,或标签指示器数组/稀疏矩阵真实值(正确)目标值。y_pred:1d类似数组,或标签指示器数组/稀疏矩阵分类器返回的预测值。labels:数组形状(n_标签),默认值=无要包含在报告中的标签索引的可选列表。其返回值为根据这组样本的真实值与预测值计算出的‘precision’、‘reca..原创 2021-12-09 10:49:38 · 3068 阅读 · 0 评论