安琪已经 了-CSDN博客

原创学习torchtext

pytorch-Field 源码：text/torchtext/data/field.py

2020-06-14 16:32:52 146

原创 2020.5.11 python 元类metaclass

参考资料： 1.https://www.cnblogs.com/Simon-xm/p/4034416.html 2.https://www.cnblogs.com/suguangti/p/10896196.html

2020-05-11 13:13:53 139

原创 Datawhale&阿里云天池二手车交易价格预测 Task3：特征工程

这篇博文后续会再进行补充记录针对二手车数据集中一些特征的处理。 1. 时间特征 2. 地理特征

2020-03-28 21:47:56 352

原创 Datawhale & 阿里云天池二手车交易价格预测 Task2 : 数据的探索性分析（EDA）

正在参与datawhale和阿里云天池共同举办的数据挖掘比赛~ 竞赛链接：零基础入门数据挖掘-二手车交易价格预测数据集可见的数据集包含了训练集（15w），测试集（5w）。共有包括name，brand，model等在内的30个特征（已脱敏）。数据分析及可视化 data为通过pandas从csv中读进来的dataframe格式 1.【总览数据概况】 data.describe() – 统计各个...

2020-03-24 20:53:52 820

原创 DATAWHALE-动手学深度学习PyTorch skip gram -- 训练数据的形式+负采样实践trick

对Skip gram模型一直都只是知道思想，就是由中心词预测窗口内的背景词，但是从来没有动手实现过。这次有机会从头开始实现，发现了许多实践上的问题。重点一：训练样本的形式一开始非常纠结的一个问题是：每个训练样本的形式是什么样的？例如，{w1, w2, w3, w4, w5}，以w3为中心词，window_size为2，得到context为{w1，w2，w4，w5}。那么此时的训练样本到底是i...

2020-02-24 21:23:14 244

原创 DATAWHALE-动手学深度学习PyTorch 笔记记录2 attention mask

【Attention中mask pad的weight的做法】在attention中，对attention score进行softmax时，需要考虑到query与pad计算得到的score应该忽略。我们在处理时可以先正常地用高维tensor形式将所有score计算出来，然后根据key的句长将pad所在位置的weight进行mask掉。下面的代码实现了给定二维tensor X，根据X_len将X中...

2020-02-18 16:43:29 973

原创 Datawhale动手学深度学习 -- 笔记

1.数据展示的只是feature的其中一维和label之间的关系~ 可以用下面的代码展示二维的feature和label之间的关系 2.我认为这里的代码实现的并不是sgd方法，而是mbgd。sgd是每次随机选择一个样本点来更新梯度，代码中实现的是每次用batch_size中所有的数据来更新梯度。 3.训练部分的代码，sgd优化部分给的代码是sgd([w,d], lr, batch_size...

2020-02-14 18:29:53 183

原创 pandas使用

随机取出dataframe中的一些行，且显示出的行index还是按照顺序 pd.sample(frac=0.2).reset_index(drop=True)

2019-07-26 11:37:11 85

原创 lstm+attention 用于NER

论文参考：https://academic.oup.com/bioinformatics/article/34/8/1381/4657076 Ling Luo, Zhihao Yang, Pei Yang, Yin Zhang, Lei Wang, Hongfei Lin, Jian Wang. An Attention-based BiLSTM-CRF Approach to Document-...

2019-07-25 11:18:07 3225

原创 ubuntu16.04 无sudo权限安装torch7详细流程

无sudo权限安装torch7是真的挺麻烦的，网上相关的很详尽的文章也比较少，现作以记录。 torch的安装过程，在ubuntu中依次输入命令： git clone https://github.com/torch/distro.git ~/torch --recursive #下载torch安装包，并放在torch文件夹下 cd ~/torch #打开torch文件夹 ./inst...

2019-05-10 14:52:03 938

weixin_43246794的博客