大牛分享
一只进阶的程序媛
好好工作,热爱生活
展开
-
努力one
最近秋招也已经慢慢接近尾声了,从去年8月底开始,先后参加了datacastle,阿里天池,牛客网各自举办的数据挖掘比赛(都是top10),今年4月份又先后去百度,腾讯实习,到现在秋招快结束,也将近一年的时间,最终拿到手的比较有分量的报价主要是腾讯,百度,华为三家企业的报价,都是sp,下面就将过去一年的一些经验做一下小总结,不一定是最合适的方法,但是当毫无头绪的时候,可以参考参考。 (一)简介...转载 2018-07-31 16:09:06 · 217 阅读 · 1 评论 -
【深度学习】深入理解Batch Normalization批标准化
Batch Normalization作为最近一年来DL的重要成果,已经广泛被证明其有效性和重要性。虽然有些细节处理还解释不清其理论原因,但是实践证明好用才是真的好,别忘了DL从Hinton对深层网络做Pre-Train开始就是一个经验领先于理论分析的偏经验的一门学问。本文是对论文《Batch Normalization: Accelerating Deep Network Trai...转载 2019-07-22 14:51:23 · 197 阅读 · 0 评论 -
Pycharm连接服务器环境配置
记录自己走的坑:1、先打开Xshell或者SecureCRT,有跳板机先连跳板机,连服务器之后第一步完成上传文件点击“连接SFTP标签页”,直接拖拽文件到此2、打开Pycharm—>Setting—>项目配置—>add添加自己的服务21.*.*.*,然后自己的用户名密码—>对勾选择自动上传文件(程序数据有所改动都会自动上传)—>点击ok3、等待更新上传...原创 2019-07-30 17:17:11 · 795 阅读 · 0 评论 -
用Python构建NLP Pipeline思路
面向用户:对NLP感兴趣,想学习处理问题思路并通过实例代码练手今天的文章由作者Adam Geitgey授权在人工智能头条翻译发布。不仅给出了具体代码,还一步步详细解析了实现原理和思路。正所谓有了思路,无论是做英语、汉语的语言处理,才算的上有了指导意义。计算机是如何理解人类语言的?让机器理解人类语言,是一件非常困难的事情。计算机的专长在处理结构化数据,但人类语言是非常复杂的,碎片化,...转载 2019-06-28 17:16:34 · 902 阅读 · 0 评论 -
【论文笔记】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
本文主要用于记录谷歌发表于2018年的一篇论文。该论文提出的BERT模型被各地学者媒体美誉为NLP新一代大杀器。本笔记主要为方便初学者快速入门,以及自我回顾。论文链接:https://arxiv.org/pdf/1706.03762.pdf基本目录如下:摘要 核心思想 总结------------------第一菇 - 摘要------------------1.1 论文摘要...转载 2019-06-25 10:22:47 · 912 阅读 · 0 评论 -
自然语言处理入门指南(python实现)
High Lights用python实现NLP的入门指南学习实现NLP的各种技术,包括解析和文本处理了解如何将NLP用于文本特征工程前言大部分数据都是以结构化形式存在的,而文本数据是非结构化数据,比如推文,帖子,聊天对话,新闻,博客文章,产品等。尽管具有高维数据,但需要手动处理才能直接访问。目录1. NLP简介2. 文本预处理2.1 噪声消除2.2 词典规范化词性还原词...翻译 2019-06-12 22:06:23 · 3867 阅读 · 2 评论 -
(转载)TF-IDF与余弦相似性的应用(二):找出相似文章
原博链接:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html上一次,我用TF-IDF算法自动提取关键词。今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。为了找出相似的文章,需要用到"余弦相似性"(c...转载 2019-04-30 16:42:30 · 132 阅读 · 0 评论 -
TF-IDF与余弦相似性的应用(一):自动提取关键词
原博链接:http://www.ruanyifeng.com/blog/2013/03/tf-idf.html这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,...转载 2019-04-30 16:40:24 · 158 阅读 · 0 评论 -
TCP三次握手经典解释
链接:https://www.nowcoder.com/questionTerminal/ec843c8a27c84a7693865f55a71a7e8c来源:牛客网三次握手的最主要目的是保证连接是双工的,可靠更多的是通过重传机制来保证的。 但是为什么一定要进行三次握手来保证连接是双工的呢,一次不行么?两次不行么?我们举一个现实生活中两个人进行语言沟通的例子来模拟三次握手。第...转载 2019-04-08 21:58:21 · 1615 阅读 · 1 评论 -
转载/Seaborn库
原文出处:https://www.cnblogs.com/kylinlin/p/5236601.htmlSeaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。安装seabo...转载 2019-01-05 17:23:07 · 210 阅读 · 0 评论 -
用隐马尔可夫模型(HMM)做命名实体识别——NER系列(一)
原博python2写的,文末是我改的python3代码隐马尔可夫模型,看上去,和序列标注问题是天然适配的,所以自然而然的,早期很多做命名实体识别和词性标注的算法,都采用了这个模型。这篇文章我将基于码农场的这篇文章《层叠HMM-Viterbi角色标注模型下的机构名识别》,来做解读。但原文中的这个算法实现是融入在HanLP里面的。不过他也有相应的训练词典,所以我在这篇文章里面也给出一个py...转载 2019-08-20 18:40:52 · 4224 阅读 · 0 评论