- 博客(105)
- 资源 (1)
- 收藏
- 关注
转载 【深度学习】翻译:60分钟入门PyTorch(二)——Autograd自动求导
前言 原文翻译自:Deep Learning with PyTorch: A 60 Minute Blitz翻译:林不清(https://www.zhihu.com/people/lu-...
2021-01-31 11:00:00 420
转载 【NLP】NER数据标注中的标签一致性验证
最近看到一篇论文,是探讨关于NER数据标注中标签一致性问题的。数据标注在建立基准和确保使用正确的信息来学习NER模型方面起着至关重要的作用。要想获得准确的标签,不仅需要时...
2021-01-31 11:00:00 2587 2
转载 【推荐系统】手写ItemCF/UserCF代码,你会吗?
前言之前朋友说有同学在面字节算法实习时让复现DeepFM算法(包括训练),然后就懵了。因此最近在整理传统推荐算法的一些内容时,大概是这样的:就想到「基于邻域的协同过滤(UserCF与It...
2021-01-31 11:00:00 540
转载 72万奖金!DCIC 2021数据竞赛正式报名了!
Datawhale赛事主办单位:数字中国建设峰会组委会1月25日,2021数字中国创新大赛大数据赛道—城市管理大数据专题,这一专注于提升城市精细化、智能化、人性化管理水平的赛事正式开...
2021-01-31 11:00:00 712 1
转载 【数据竞赛】Kaggle GM秘技:树模型初始化技巧
作者:尘沙樱落树模型初始化技巧大家都知道神经网络训练的提升分数的技巧之一就是:依据验证集合的效果,来调整learning rate的大小,从而获得更好的效果;但我们在训练树模型的时候...
2021-01-30 11:30:00 349
转载 【论文解读】基于关系感知的全局注意力
一、论文信息标题:《Relation-Aware Global Attention for Person Re-identification》作者:Zhizheng Zhang et a...
2021-01-30 11:30:00 1775 1
转载 干货丨深度迁移学习方法的基本思路(文末送书)
百度前首席科学家、斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力。本文选自《深度学习500问:AI工程师面试宝典》...
2021-01-30 11:30:00 524
转载 【深度学习】翻译:60分钟入门PyTorch(一)——Tensors
前言 原文翻译自:Deep Learning with PyTorch: A 60 Minute Blitz翻译:林不清(https://www.zhihu.com/people/lu-...
2021-01-30 11:30:00 298
转载 【面试招聘】算法岗通关宝典 | 社招一年经验,字节5轮、阿里7轮
作者|BatmanYang编辑|NewBeeNLP公众号字节一面问贝叶斯网络的原理。一些统计学的原理比如t-test, AUC curve的意义是啥,为什么要用AUC去衡量机...
2021-01-29 11:30:00 551
转载 【深度学习】吃得满意又健康?AI 营养师比人类营养师更懂你
内容提要:合理膳食、营养均衡的重要性已不必多说,但具体如何落实,却不简单。为了得到搭配更合理、更健康、更符合人们口味的食谱,AI 也加入了营养师的队伍。关键词:饮食推荐营养均衡推荐系...
2021-01-29 11:30:00 816
转载 【数据竞赛】从0梳理1场数据挖掘赛事!
作者:王茂霖,华中科技大学,Datawhale成员摘要:数据竞赛对于大家理论实践和增加履历帮助比较大,但许多读者反馈不知道如何入门,本文以河北高校数据挖掘邀请赛为背景,完整梳理了从环境准...
2021-01-29 11:30:00 718 1
转载 【强化学习】DQN 的三种改进在运筹学中的应用
这篇文章主要介绍 DQN 的三种改进:Nature DQN、Double DQN、Dueling DQN 在运筹学中的应用,并给出三者的对比,同时也会给出不同增量学习下的效果。这三种具体...
2021-01-28 11:30:00 1117
转载 【Python基础】pandas的骚操作:一行 pandas 代码搞定 Excel “条件格式”!
来源:Python数据科学作者:东哥起飞本篇是pandas100个骚操作系列的第 7篇:一行 pandas 代码搞定 Excel “条件格式”!系列内容,请看????「pandas10...
2021-01-28 11:30:00 908
转载 Github Star 9.2K,超级好用的OCR数据合成与半自动标注工具,强烈推荐!
一、导读 OCR方向的工程师,一定需要知道这个OCR开源项目:PaddleOCR短短几个月,累计Star数量已超过9.2K;频频登上Github Trending 日榜月榜;称它为 OC...
2021-01-28 11:30:00 549
转载 【强化学习】开源环境集(魂斗罗、星际争霸等都有!)
游戏环境OpenAI Gym RetroOpenAI 发布的增强的游戏强化学习研究平台,Gym Retro。其中包括对任天堂 Game boy,NES, 世嘉游戏等各种模拟器的支持。通过...
2021-01-27 11:36:44 1661 2
转载 【NLP】竞赛中的文本相似性!
文本相似度是指衡量两个文本的相似程度,相似程度的评价有很多角度:单纯的字面相似度(例如:我和他 v.s. 我和她),语义的相似度(例如:爸爸 v.s. 父亲)和风格的相似度(例如:我喜欢...
2021-01-27 11:36:44 883
转载 【职场】给跨专业程序员的一些建议
我叫郑宇,最近看了公子龙分享的三个程序员去考公务员了,原因是被互联网行业毒打,最近又有拼夕夕跳楼的,996又被推向啦高潮。很多人说互联网行业的内卷,搞得人心慌张。我也是跨专业的程序员,本...
2021-01-26 11:00:00 373
转载 【学术相关】现阶段硕士的困境:读博没信心,不读还闹心
1找工作好难偶然间听人感慨:为什么找工作这么 TM 难?估计这是个世纪难题,也没有标准答案。大家也都差不多,遇不到合适的岗位。昨天一个同学和我说:我准备读博了,申请已经提交了,和他多聊...
2021-01-26 11:00:00 287 1
转载 【学术技巧】让你的 GitHub 秒变高大上!
GitHub 是世界上最大的程序员交友社区,在这里有很多优秀的开源项目和程序员大牛,是提升编程能力的圣地。最近逛 GitHub 的时候,发现一些大牛的个人主页和我的长得不一样,多了一个可...
2021-01-25 11:00:00 273
转载 【机器学习基础】Python机器学习的神器- Scikit-learn使用说明
全文共 26745 字,106 幅图表,预计阅读时间 67 分钟。0引言Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具。它建立在 NumPy...
2021-01-25 11:00:00 902
转载 【Python基础】这个Pandas函数可以自动爬取Web图表
Pandas作为数据科学领域鳌头独占的利器,有着丰富多样的函数,能实现各种意想不到的功能。作为学习者没办法一次性掌握Pandas所有的方法,需要慢慢积累,多看多练。这次为大家介绍一个非常...
2021-01-25 11:00:00 422
转载 【数据竞赛】高质量数据科学竞赛平台汇总
前言学习过机器学习算法的小伙伴大多数都听说过“打比赛”,一些同学自己参与过一些比赛项目,从中获益匪浅。今天来详细罗列一下国内外的比赛平台,方便即时找到自己感兴趣的项目,pc点击阅读原文可...
2021-01-24 10:58:54 733
转载 【Python基础】Python轻量级循环-列表推导式
概 述Python 列表推导式(list comprehension)利用其他列表创建新的列表,工作方式类似于for循环,使用列表推导式可以快速生成一个列表,或者根据某个列表生成满足指...
2021-01-24 10:58:54 446
转载 78万奖金!天池最新CV大赛来了
主办单位丽水市人民政府,阿里巴巴集团赛事简介首届全国绿色生态创新大赛是由丽水市人民政府联合阿里巴巴集团共同启动的,以「数字化下沉」为主题的全国性创新大赛。赛事汇聚全国科技创新人才,发掘数...
2021-01-24 10:58:54 203
转载 【NLP】不讲武德,只用标签名就能做文本分类
文 | 谁动了我的炼丹炉编 | 兔子酱今天给大家介绍一篇微软研究院在EMNLP2020上发表的论文,主题是弱监督文本分类。看到标题的你可能会和我刚开始一样震惊,只是知道标签名怎么给文本分...
2021-01-23 11:00:00 400
转载 【机器学习基础】(二):理解线性回归与梯度下降并做简单预测
预测从瞎猜开始按上一篇文章所说,机器学习是应用数学方法在数据中发现规律的过程。既然数学是对现实世界的解释,那么我们回归现实世界,做一些对照的想象。想象我们面前有一块塑料泡沫做的白板,白板...
2021-01-23 11:00:00 304
转载 【论文解读】经典CNN对2D&3D掌纹及掌静脉识别的性能评估
掌纹识别(palmprint recognition)及掌静脉识别(palm vein recognition)作为两种新兴的生物特征识别技术已经引起广泛关注。最近几年,深度学习已经成为...
2021-01-23 11:00:00 2886
转载 【深度学习】遗传算法优化GAN
作者 | Victor Sim编译 | VK来源| Towards Data ScienceGANs是计算量最大的模型之一,因为它相当于同时训练两个神经网络。对于我那台糟糕的便携式...
2021-01-22 11:00:00 2307
转载 【机器学习基础】(一):5分钟理解机器学习并上手实践
引言现在市面上的机器学习教程大多先学习数学基础,然后学机器学习的数学算法,再建立机器学习的数学模型,再学习深度学习,再学习工程化,再考虑落地。这其中每个环节都在快速发展,唯独落地特别困难...
2021-01-22 11:00:00 316
转载 2020年这10大ML、NLP研究最具影响力:为什么?接下来如何发展?
选自ruder.io作者:Sebastian Ruder机器之心编译机器之心编辑部去年有哪些机器学习重要进展是你必须关注的?听听 DeepMind 研究科学家怎么说。2020 年因为新冠...
2021-01-22 11:00:00 350
转载 【机器学习基础】前置知识(五):30分钟掌握常用Matplotlib用法
Matplotlib 是建立在NumPy基础之上的Python绘图库,是在机器学习中用于数据可视化的工具。我们在前面的文章讲过NumPy的用法,这里我们就不展开讨论NumPy的相关知识了...
2021-01-21 11:30:00 1030
转载 【数据分析】pandas增删改查!sql2pandas方法手册
数据分析Author:louwillMachine Learning Lab 作为一名数据分析师or算法工程师,利用SQL熟练的取数是一项必备的基础能力。除了SQL以外,Pyth...
2021-01-21 11:30:00 460
转载 那些数学不好的程序员?最后都如何了(文末送书)
不能说每个深耕机器学习的人都学过吴恩达的《机器学习》课程,但他的这门课确是目前让机器学习初学者能够快速对整个体系知识点有比较整体的认识,便于快速入门的首选及最热课程。根据2019年Fr...
2021-01-21 11:30:00 181
转载 【NLP】篇章级机器翻译简介
作者:哈工大SCIR 聂润泽1.摘要现今神经机器翻译系统已取得很好的效果,基于 Transformer 的翻译模型在各种翻译任务中均取得了先进的表现,但如何使用文档级上下文处理语篇现象仍...
2021-01-21 11:30:00 1725
转载 阿里云天池发布完整开源数据集!实测可下!
来源:Tianchi,方向:开源数据集,来源:Datawhale近期,Tianchi发布了一份非常全面的开源数据集。包含了计算机视觉,自然语言处理,金融,电商,医疗,工业,农业等数据集,...
2021-01-20 12:00:00 8521 1
原创 【Python基础】拯救你奇丑无比的Python代码的神器
Python编程语言需要遵循PEP8规范,但是初学者往往记不住这个规范,代码写得比较丑。本文推荐几个神器来拯救奇丑无边的python代码。一、Jupyter notebook 篇 Jup...
2021-01-20 12:00:00 215
转载 【机器学习基础】前置知识(四):一文掌握Pandas用法
Pandas提供快速,灵活和富于表现力的数据结构,是强大的数据分析Python库。本文收录于机器学习前置教程系列。一、Series和DataFramePandas建立在NumPy之上,更...
2021-01-20 12:00:00 526
转载 【数据分析】近10年学术论文的数据分析!
作者:李攀,北航硕士,Datawhale优秀学习者arXiv是重要的学术公开网站,也是搜索、浏览和下载学术论文的重要工具。它涵盖的范围非常广,涉及物理学的庞大分支和计算机科学的众多子学科...
2021-01-20 12:00:00 1481
转载 如何成为一名合格的推荐系统工程师?
由于近些年深度学习技术的飞速发展,大力加速推动了AI在互联网以及传统各个行业的商业化落地,其中,推荐系统、计算广告等领域彰显的尤为明显。由于推荐系统与提升用户量以及商业化变现有着密不可分...
2021-01-19 19:29:00 598
转载 【论文解读】FcaNet:频率通道注意力网络论文解读
导读改一行代码就能涨点,这么好的事情,还不赶紧来看看,用不同的频率分量来做注意力,确实有效果!论文:https://arxiv.org/abs/2012.118791、介绍注意力机制有很...
2021-01-19 19:29:00 1229 2
斯坦福大学机器学习课程个人笔记v4.06
2016-03-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人