- 博客(10)
- 收藏
- 关注
原创 2020.5.11 python 元类metaclass
参考资料:1.https://www.cnblogs.com/Simon-xm/p/4034416.html2.https://www.cnblogs.com/suguangti/p/10896196.html
2020-05-11 13:13:53
138
原创 Datawhale&阿里云天池 二手车交易价格预测 Task3:特征工程
这篇博文后续会再进行补充记录针对二手车数据集中一些特征的处理。1. 时间特征2. 地理特征
2020-03-28 21:47:56
345
原创 Datawhale & 阿里云天池 二手车交易价格预测 Task2 : 数据的探索性分析(EDA)
正在参与datawhale和阿里云天池共同举办的数据挖掘比赛~竞赛链接:零基础入门数据挖掘-二手车交易价格预测数据集可见的数据集包含了训练集(15w),测试集(5w)。共有包括name,brand,model等在内的30个特征(已脱敏)。数据分析及可视化data为通过pandas从csv中读进来的dataframe格式1.【总览数据概况】data.describe() – 统计各个...
2020-03-24 20:53:52
816
原创 DATAWHALE-动手学深度学习PyTorch skip gram -- 训练数据的形式+负采样实践trick
对Skip gram模型一直都只是知道思想,就是由中心词预测窗口内的背景词,但是从来没有动手实现过。这次有机会从头开始实现,发现了许多实践上的问题。重点一:训练样本的形式一开始非常纠结的一个问题是:每个训练样本的形式是什么样的?例如,{w1, w2, w3, w4, w5},以w3为中心词,window_size为2,得到context为{w1,w2,w4,w5}。那么此时的训练样本到底是i...
2020-02-24 21:23:14
244
原创 DATAWHALE-动手学深度学习PyTorch 笔记记录2 attention mask
【Attention中mask pad的weight的做法】在attention中,对attention score进行softmax时,需要考虑到query与pad计算得到的score应该忽略。我们在处理时可以先正常地用高维tensor形式将所有score计算出来,然后根据key的句长将pad所在位置的weight进行mask掉。下面的代码实现了给定二维tensor X,根据X_len将X中...
2020-02-18 16:43:29
970
原创 Datawhale动手学深度学习 -- 笔记
1.数据展示的只是feature的其中一维和label之间的关系~可以用下面的代码展示二维的feature和label之间的关系2.我认为这里的代码实现的并不是sgd方法,而是mbgd。sgd是每次随机选择一个样本点来更新梯度,代码中实现的是每次用batch_size中所有的数据来更新梯度。3.训练部分的代码,sgd优化部分给的代码是sgd([w,d], lr, batch_size...
2020-02-14 18:29:53
182
原创 pandas使用
随机取出dataframe中的一些行,且显示出的行index还是按照顺序pd.sample(frac=0.2).reset_index(drop=True)
2019-07-26 11:37:11
85
原创 lstm+attention 用于NER
论文参考:https://academic.oup.com/bioinformatics/article/34/8/1381/4657076Ling Luo, Zhihao Yang, Pei Yang, Yin Zhang, Lei Wang, Hongfei Lin, Jian Wang. An Attention-based BiLSTM-CRF Approach to Document-...
2019-07-25 11:18:07
3224
原创 ubuntu16.04 无sudo权限安装torch7详细流程
无sudo权限安装torch7是真的挺麻烦的,网上相关的很详尽的文章也比较少,现作以记录。torch的安装过程,在ubuntu中依次输入命令:git clone https://github.com/torch/distro.git ~/torch --recursive #下载torch安装包,并放在torch文件夹下cd ~/torch #打开torch文件夹./inst...
2019-05-10 14:52:03
935
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人