![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
个人学习笔记——初版
文章平均质量分 50
就是一顿骚操作
自律。做更好的自己!python,数据平台,自然语言处理。
90后、詹姆斯、意难忘、beyond、巨蟹座、平凡的世界、夜访吸血鬼。。。默默耕耘,为这个世界带来些什么。。
展开
-
pytorch快速入门中文——01
无缝替换NumPy,并且通过利用GPU的算力来实现神经网络的加速。通过自动微分机制,来让神经网络的实现变得更加容易。原创 2023-06-28 16:56:08 · 1210 阅读 · 0 评论 -
python字典和集合——笔记
也就是说,如果有一个类继承了dict,然后这个继承类提供了__missing__方法,那么在__getitem__碰到找不到的键的时候,Python就会自动调用它,而不是抛出一个KeyError异常。如果给这个类一个映射,它会返回一个只读的映射视图。因为Python会设法保证大概还有三分之一的表元是空的,所以在快要达到这个阈值的时候,原有的散列表会被复制到一个更大的空间里面。1.1如果一个对象是可散列的,那么在这个对象的生命周期中,它的散列值是不变的,而且这个对象需要实现__hash__( )方法。原创 2023-03-05 12:49:31 · 564 阅读 · 0 评论 -
torch.nn中GRU使用
【代码】torch.nn中GRU使用。原创 2022-10-10 13:56:26 · 3161 阅读 · 0 评论 -
随笔记录——gensim word2vector使用
实现例子:这里是处理文本翻译数据集,这里使用word2vec进行词嵌入。原创 2022-10-09 16:09:24 · 398 阅读 · 0 评论 -
随笔记录——pandas 中 Dataframe.to_dict()
在工作中,使用pandas时,常常需要将dataframe中的数据按照指定的格式输出给下游使用,很多时候,下游指定的格式并不是很特别,而是比较常见的,这时,我们就不需要自己专门定义方法去处理了,可以先看一下有没有现成的方法可以调用,会节省我们很多时间,提高我们程序的效率。下面我介绍一下dataframe的一个格式化输出的方法,to_dict()1、 使用默认的to_dict()格式化输出df = pd.DataFrame({'col1': [1, 2], 'col原创 2022-03-30 14:21:30 · 2750 阅读 · 0 评论 -
使用torch随机初始化参数
1、从均匀分布中生成值w = torch.zeros(3, 5)wOut[75]: tensor([[0., 0., 0., 0., 0.], [0., 0., 0., 0., 0.], [0., 0., 0., 0., 0.]])torch.nn.init.uniform_(w, a=10, b=15)Out[76]: tensor([[11.8949, 11.0836, 10.6348, 13.4524, 12.8051], [14.5289原创 2022-03-21 18:09:46 · 2731 阅读 · 0 评论 -
随笔记录——pytorch创建tensor函数
1、通过复制数据构造张量1.1 torch.tensor()torch.tensor([[0.1, 1.2], [2.2, 3.1], [4.9, 5.2]])Out[111]: tensor([[0.1000, 1.2000], [2.2000, 3.1000], [4.9000, 5.2000]])torch.tensor([0, 1]) Out[112]: tensor([0, 1])torch.tensor([[0.11111, 0.222222, 0.原创 2022-03-21 15:23:01 · 2080 阅读 · 0 评论 -
随笔记录——pytorch一元通用函数
1、获取一维tensor中的最大值import torcha = torch.randn(1, 3)aOut[4]: tensor([[-0.6893, -0.3273, 0.6810]])torch.max(a)Out[5]: tensor(0.6810)1.1、 二维或者更多维数据中,获取各个维度的最大值a = torch.randn(4, 4)aOut[7]: tensor([[ 0.0531, 0.1278, 0.0252, -0.7423], [ 0原创 2022-03-16 18:40:20 · 3414 阅读 · 0 评论 -
随笔记录——混淆矩阵(机器学习)
正确率在分类问题中最常见的指标是正确率(Accuracy),表示模型预测正确的样本比例。 正确率的定义如下:Accuracy=TP+TNTN+FN+FP+FNAccuracy = \frac{TP + TN}{TN+FN+FP+FN}Accuracy=TN+FN+FP+FNTP+TN正确率指标在样本不均衡的时候不是一个很好的度量模型好坏的指标。例如在文本情绪分类数据集中,正面的样本占比为80%,负面的内容占比只有20%。如果一个分类模型将所有的样本都预测为正面,这个模型显然是一个无用的模型,但是它的.原创 2022-03-16 11:21:48 · 1052 阅读 · 0 评论 -
pyahocorasick使用(ac自动机)
一、简介pyahocorasick是一个快速高效的库,用于精确或近似的多模式字符串搜索,这意味着您可以在一些输入文本中同时找到多个关键字字符串。字符串“索引”可以提前构建,并保存(作为pickle)到磁盘,以便以后重新使用。该库提供了一个ahocarasick Python模块,您可以将其用作Trie之类的普通dict,或者将Trie转换为自动机,以实现高效的Aho-Carasick搜索。二、安装pip install pyahocorasick三、使用1.新建自动机可以将Automaton类原创 2022-03-15 10:54:20 · 2080 阅读 · 0 评论 -
随笔记录(扩展)——np.where
where基本使用15.1、使用where 按照条件查询出两个字段的值xarr = np.array([1, 2, 3, 4, 5])yarr = np.array([-1, -2, -3, -4, -5])cond = np.array([True, False, True, False, False])np.where(cond, xarr, yarr)Out[174]: array([ 1, -2, 3, -4, -5])15.2、使用where在原有的array中填充常数a原创 2022-03-14 14:48:07 · 1275 阅读 · 0 评论 -
随笔记录——torch.squeeze/torch.unsqueeze
使用squeeze()移除输入的tensor中,大小为1的维度import torchx = torch.zeros(2, 1, 2, 1, 2)y = torch.squeeze(x)y.shapetorch.Size([2, 2, 2])使用squeeze()移除输入的tensor中,指定维度的大小为1的维度y = torch.squeeze(x, 0)y.shapetorch.Size([2, 1, 2, 1, 2])y = torch.squeeze(x, 1)y.sha原创 2022-03-08 14:42:19 · 169 阅读 · 0 评论 -
随笔记录——numpy.pad()
1.直接对列表两端进行填充a = list(range(1, 6))np.pad(array=a, pad_width=(2, 3), mode='constant', constant_values=(100, -100))Out[12]: array([ 100, 100, 1, 2, 3, 4, 5, -100, -100, -100])其中array: 需要pad的列表pad_width: 填充到每个轴边缘的数值,在这里,就是说在 左边填充两个元素,原创 2022-03-07 15:56:02 · 2788 阅读 · 0 评论 -
随笔记录——python中的日期和时间数据处理
一、标准库中的日期和时间处理1、使用datetime包计算时间1.1 使用datetime包获取当前时间from datetime import datetimenow = datetime.now()nowOut[3]: datetime.datetime(2022, 3, 4, 17, 16, 55, 703231)now.year, now.month, now.dayOut[4]: (2022, 3, 4)1.2、计算两个datetime的时间差delta = datet原创 2022-03-04 18:24:33 · 606 阅读 · 0 评论 -
随笔记录——pandas(数据联合)
5、根据索引合并DataFrame中用于合并的键是它的索引。在这种情况下,你可以传递left_index=True或right_index=True(或者都传)来表示索引需要用来作为合并的键:df1 = pd.DataFrame({'col1':range(5), 'col2':['a', 'b', 'c', 'd', 'e']})df1Out[91]: col1 col20 0 a1 1 b2 2 c3 3 d4原创 2022-03-03 14:39:24 · 674 阅读 · 0 评论 -
随笔记录——pandas(数据联合与合并)
包含在pandas对象的数据可以通过多种方式联合在一起:pandas.merge根据一个或多个键将行进行连接。对于SQL或其他关系型数据库的用户来说,这种方式比较熟悉,它实现的是数据库的连接操作。pandas.concat使对象在轴向上进行黏合或“堆叠”。combine_first实例方法允许将重叠的数据拼接在一起,以使用一个对象中的值填充另一个对象中的缺失值。1.1、两个df都存在相同key,进行mergedf1 = pd.DataFrame({'col1':range(6), 'col1_原创 2022-03-01 16:01:14 · 2838 阅读 · 0 评论 -
随笔记录——numpy2
12、 数组转置arr = np.arange(12).reshape((4, 3))arrOut[114]: array([[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11]])arr.TOut[115]: array([[ 0, 3, 6, 9], [ 1, 4, 7, 10], [ 2, 5, 8, 11]])12.1、矩阵內积np.dot(原创 2022-02-21 11:22:56 · 792 阅读 · 0 评论 -
随笔记录——numpy1
10、假设每个人名都和data数组中的一行相对应,并且我们想要选中所有’nana’对应的行。names = np.array(['nana', 'zhengzheng', 'fangfang', 'zhengzheng', 'nana', 'dingding', 'huanhuan'])data = np.random.rand(7, 5)dataOut[83]: array([[0.36880059, 0.8395524 , 0.1620856 , 0.43745294, 0.60072609]原创 2022-02-18 15:54:55 · 467 阅读 · 0 评论 -
随笔记录——numpy
1、生成随机数import numpy as npdata = np.random.randn(2, 3)dataarray([[-0.06180816, -0.34319508, 0.28056151], [-0.15430366, -0.7140969 , -1.67410168]])#####1.1 给随机数加上一个data*10array([[ -0.61808156, -3.43195079, 2.80561508], [ -1.54303661原创 2022-02-16 18:37:06 · 462 阅读 · 0 评论