ML 自学者周刊:第 5 期

刊首语

这里记录ML自学者群体,每周分享优秀的学习心得与资料。由于微信不允许外部链接,需要点击文末的「阅读原文」,才能访问文中的链接。

本期内容

论文阅读

•ACL2018:多语义词向量的编码•阿里电商诉讼预测多任务模型•EMNLP2019: 短文本分类的异质图注意力网络

学习心得

•小强:Encoder-Decoder•君君:YOLO 框架学习•昨夜星辰:词向量学习•君君:研究图像模态转换模型•奔腾:科大讯飞比赛总结•曲奇:优化理论的多目标规划问题

疑问解答

•特征工程中的归一化有什么作用•如何解释准确率、召回率和F值•特征抽取、特征选择、变化组合区别

论文阅读

ACL2018:多语义词向量的编码

阅读论文 ACL2018 上的: Probabilistic FastText for Multi-Sense Word Embeddings

已有方法不能很好的应对稀有词与词汇表没有的词的语义问题,文章提出来一种概率词模型,将高斯混合概率与FastText模型结合,具有灵活的子词结构。

高斯分量可以得到多义词意义上的分离,FastText子词结构获取到更多字符级信息与不确定的信息,从而提供了高质量的语义表达。文章模型在一些词相似度数据集上的表现优于之前的模型,在罕见词数据集和其他语言数据集上也有较好的效果。本文工作首次利用多模态嵌入来解决罕见词的问题。

论文地址[1]

阿里电商诉讼预测多任务模型

今天给大家分享一篇阿里使用多任务模型做电商诉讼预测的论文。论文地址:Legal Intelligence for E-commerce。

首先介绍一下文章背景,一般来说会先有电商纠纷(一般是在线的,所以此过程也称为ODR,online dispute resolution),如果买卖双方对纠纷处理结果不满意的话一般会通过律法途径将纠纷问题转为诉讼问题。而诉讼需要请律师(高额的费用),同时法官也需要收集各方面的信息(包括买卖方的历史数据及平台聊天记录等),这些都给诉讼处理带来了很大的困难。

那么诉讼预测会面临什么问题呢?

LDJ(legal dispute judgement)任务在NLP领域做得相对较为成熟,但是电商纠纷/诉讼预测与LDJ还是有一定的区别,所以不能直接套用LDJ预测的方法来解决电商纠纷/诉讼预测任务,但是作者表示这两者有一定的相似度。

相对于纠纷数据来说,电商诉讼数据更为稀疏,也就是训练数据少。

总体上来说,作者使用了多任务网络的模型,纠纷数据训练底层表示,使用诉讼数据微调更上层的网络。

这篇文章会介绍好几次,这次先讲个大概吧。

论文地址[2]

EMNLP2019: 短文本分类的异质图注意力网络

短文本分类在新闻及微博等领域得到了广泛的应用。但是,目前的文本分类算法主要集中于长文本分类并且无法直接应用于短文本分类。这是由于短文本分类的两个独有挑战:数据的稀疏和歧义、标签数量较少。

针对上述两个挑战,本文创新地将短文本建模为异质图,通过图数据的复杂交互来解决数据稀疏和歧义带来的挑战。同时,本文提出了一种异质图注意力 HGAT 来学习短文本的表示并进行分类。HGAT 是一种半监督学习算法可以更好的适用于标签数量较少的场景,如短文本的分类。

论文地址[3]

学习心得

小强:Encoder-Decoder

本周在看 encoder–decoder,seq2seq,attention 相关的东西。

由于时间不够,先简单说几点收获,过几天发成文。

encoder–decoder 是一个很大的范畴,不论编码和解码用的什么算法,只要是『编码–解码』的结构都算这个范畴。

seq2seq 和 encoder–decoder很像。也是编码和解码的过程,不过范围更小,基本限定在了nlp和语音这种序列特征很强的。

如果说encoder–decoder是一种『有损压缩』,在把长文本转化为固定向量的过程会损失一些信息。那么attention就更倾向于无损压缩,更好的保留了信息。

君君:YOLO 框架学习

这周看了R-CNN,fast R-CNN,SPP,YOLOv1,YOLOv2的框架结构。觉得YOLO这么简单地模型能有这么高的精确率以及效率是真的厉害。

另外在darknet上跑了下YOLO的预测模型,好奇darknet是怎么用yolo.cfg构造tensorflow模型,就去一行一行看darknet源代码,看得人脑壳疼。看过之后莫名觉得代码能力level+1。

为了高效刷leetcode,找了本算法书籍补补算法代码基础(纯数学系毕业工作才接触的Python+深度学习,觉得硬算法方面太欠缺了),看得比较零散暂时没有总结。

昨夜星辰:词向量学习

最近在学词向量的发展史及代码实战。从 one-hot,词袋,tf-idf到分布式表示,如NNLM,以及后来的 word2vec,fasttext,glove,elmo,gpt。

在看到bert时,还是避免不了之前transformer等基础。因此在代码实战上阅读paper原文,掌握原理。希望将当前的基本打牢。

君君:研究图像模态转换模型

最近在研究图像模态转换的模型。从改进的condition cycle GAN ,到cycle GAN,再到Wasserstein cycle GAN。condition cycle GAN被放弃的原因正是因为condition,condition模块的存在使得预测(模态转换)过程必须具备当前图像的label,导致切图转换再还原这个流程走不通。

cycle GAN训练过程中loss_D起伏波动无法很好收敛(尽管大多数类别图像模态转换已经很逼真,但还有少数类别无法完美转换),网上查找之后发现这个原因很有可能是因为GAN本身难收敛的原因,并且为了缓解这种情况已经有人提出了Wasserstein GAN(WGAN)以及WGAN_GP。打算试试Wasserstein cycle GAN这条路能不能走通。

中间为了改进cycle GAN,在github上找了好多基于基础GAN改进的condition GAN、Wasserstein GAN的相关实现代码。参考然后嫁接到自己模型上面,发现GAN的玩法真的是太多了。下面附上两个我觉得总结很到位的GAN链接。有兴趣的可以尝试参考第一个链接[4]中的变种GAN,在第二个链接[5]中改进cycle GAN。

曲奇:优化理论的多目标规划问题

天津大学强化学习实验室同网易伏羲人工智能实验室、NTU 合作的 ASE 2019 论文《Wuji: Automatic Online Combat Game Testing Using Evolutionary Deep Reinforcement Learning》。

该论文主要融合了进化算法与深度强化学习算法,从多目标优化的角度,旨在解决大规模商业游戏的自动化智能测试问题,并荣获 ASE 2019 的最佳论文奖 (Distinguished Paper Award)。

奔腾:科大讯飞比赛总结

科大讯飞四个比赛总结

•AD分类决赛总结[6]•工业寿命预测[7]•大数据应用分类[8]•移动反欺诈[9]

疑问解答

特征工程中的归一化有什么作用[10]

引入归一化,是由于在不同评价指标中,其量纲或者是量纲单位往往不同,变化区间处于不同的数量级,若不进行归一化,可能导致某些指标被忽视,影响到数据分析的结果。

所以,为了消除特征数据之间的量纲影响,需要进行归一化处理,已解决特征指标之间的可比性。原始数据经过归一化处理后,各指标处于同一数量级,以便进行综合对比评价。

如何解释准确率、召回率和F值[11]

准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。

一般来说,Precision就是检索出来的条目(比如:文档、网页等)有多少是准确的,Recall就是所有准确的条目有多少被检索出来了。

正确率、召回率和 F 值是在鱼龙混杂的环境中,选出目标的重要评价指标。不妨看看这些指标的定义先:

•正确率 = 提取出的正确信息条数 / 提取出的信息条数•召回率 = 提取出的正确信息条数 / 样本中的信息条数

两者取值在0和1之间,数值越接近1,查准率或查全率就越高。

•F 值 = 正确率 * 召回率 * 2 / (正确率 + 召回率) (F 值即为正确率和召回率的调和平均值)

特征抽取、特征选择、变化组合区别[12]

特征抽取,一般是从原始数据中通过计算得到一些特征,如计算用户的购买力区间,平均每个月的购买次数。特征选择:假设你抽取了100个特征,通过信息增益、互信息等等指标选择了最重要的30个用于建模;特征变换:如有个特征是用户的年薪,但是这个年薪的区间太大,我们做了一个函数变换,如log(年薪)。特征组合:如年龄区间+年薪区间做组合。

加入我们

公众号内回复「自学」,即可加入ML自学者俱乐部社群。可以投稿每周学习心得或者优质学习资料,助力团体共同学习进步。

上期精彩内容

References

[1] 论文地址: https://www.aclweb.org/anthology/P18-1001/
[2] 论文地址: https://dl.acm.org/citation.cfm?id=3331212
[3] 论文地址: http://www.shichuan.org/doc/74.pdf
[4] 第一个链接: https://github.com/MASILab/SynSeg-Net
[5] 第二个链接: https://github.com/znxlwm/pytorch-generative-model-collections
[6] AD分类决赛总结: https://blog.csdn.net/herosunly/article/details/102708654
[7] 工业寿命预测: https://blog.csdn.net/herosunly/article/details/102711266
[8] 大数据应用分类: https://blog.csdn.net/herosunly/article/details/102711596
[9] 移动反欺诈: https://blog.csdn.net/herosunly/article/details/102713094
[10] 特征工程中的归一化有什么作用: https://www.zhihu.com/question/20455227/answer/325347915
[11] 如何解释准确率、召回率和F值: http://bookshadow.com/weblog/2014/06/10/precision-recall-f-measure/
[12] 特征抽取、特征选择、变化组合区别: https://www.zhihu.com/question/20716506/answer/45658573

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。在编写C程序时,需要注意变量的声明和定义、指针的使用、内存的分配与释放等问题。C语言中常用的数据结构包括: 1. 数组:一种存储同类型数据的结构,可以进行索引访问和修改。 2. 链表:一种存储不同类型数据的结构,每个节点包含数据和指向下一个节点的指针。 3. 栈:一种后进先出(LIFO)的数据结构,可以通过压入(push)和弹出(pop)操作进行数据的存储和取出。 4. 队列:一种先进先出(FIFO)的数据结构,可以通过入队(enqueue)和出队(dequeue)操作进行数据的存储和取出。 5. 树:一种存储具有父子关系的数据结构,可以通过中序遍历、前序遍历和后序遍历等方式进行数据的访问和修改。 6. 图:一种存储具有节点和边关系的数据结构,可以通过广度优先搜索、深度优先搜索等方式进行数据的访问和修改。 这些数据结构在C语言中都有相应的实现方式,可以应用于各种不同的场景。C语言中的各种数据结构都有其优缺点,下面列举一些常见的数据结构的优缺点: 数组: 优点:访问和修改元素的速度非常快,适用于需要频繁读取和修改数据的场合。 缺点:数组的长度是固定的,不适合存储大小不固定的动态数据,另外数组在内存中是连续分配的,当数组较大时可能会导致内存碎片化。 链表: 优点:可以方便地插入和删除元素,适用于需要频繁插入和删除数据的场合。 缺点:访问和修改元素的速度相对较慢,因为需要遍历链表找到指定的节点。 栈: 优点:后进先出(LIFO)的特性使得栈在处理递归和括号匹配等问题时非常方便。 缺点:栈的空间有限,当数据量较大时可能会导致栈溢出。 队列: 优点:先进先出(FIFO)的特性使得
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
《电子工程师自学速成:提高篇》是一本针对电子工程师的自学提高资料,旨在帮助电子工程师通过自学提升自己的技能水平和知识深度。 首先,这本书适合已经具备了一定电子工程基础知识的工程师。它通过系统地介绍了电子工程师日常工作所需的各种专业知识和技能,如嵌入式系统设计、电路设计与分析、电子元器件选型与应用等。 其次,这本书采用了实际案例和具体应用场景进行讲解,帮助工程师更好地理解理论知识的实际应用。通过理论与实践的紧密结合,读者可以更加深入地了解各种电子设备的工作原理和设计思路,进一步提高自己的实际应用能力。 此外,这本书还包含了大量的实践性项目和实验,可以帮助读者巩固所学知识,并通过实际操作提高自己的动手能力。这些项目和实验都经过精心设计,力求符合实际应用场景和需求,读者在完成项目和实验的过程中能够真实地感受到电子工程的魅力和挑战。 最后,这本书还提供了一些学习方法和技巧,帮助读者更加高效地进行自学。这些方法和技巧包括如何制定学习计划、如何高效学习文献和资料、如何解决学习中遇到的问题等。这些内容不仅有助于读者在学习电子工程知识的过程中取得更好的效果,还可以帮助他们养成良好的学习习惯和科学的思维方式。 综上所述,《电子工程师自学速成:提高篇》是一本全面、系统、实践性强的电子工程师自学资料。通过学习这本书,电子工程师可以提高自己的专业技能和知识水平,成为一个更加出色的工程师。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值