自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

转载 聚类算法

聚类算法的应用转载:https://towardsdatascience.com/cluster-analysis-create-visualize-and-interpret-customer-segments-474e55d00ebbhttps://medium.com/predict/three-popular-clustering-methods-and-when-to-use-e...

2020-01-15 10:56:27 199

原创 RPC框架thrift使用笔记

记录项目中使用rpc框架thrift的过程thrift安装过程:thrift使用思考:1. 多client端同时对server端进行访问,如何保持...参考文章:1.Thrift RPC详解2.由浅入深了解Thrift系列文章3.Thrift:维基百科4.Thrift 官网...

2020-01-15 10:56:12 163

原创 lightgbm 源码分析

https://blog.csdn.net/weixin_42001089/article/details/85343332

2020-01-15 10:54:45 326

原创 Transformer详解

相关资料 :1.The Illustrated Transformer中文翻译版2. The Illustrated Transformer(配合李宏毅老师的视频看,很直观明了)2.草稿纸上的Transformer3.放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较4.bert 应用于下游任务方法代码实现:1....

2020-01-15 10:54:05 186

原创 BERT详解

论文及源码解读:1.BERT源码分析PART I2.BERT源码分析PART II3.BERT源码分析PART III4.BERT相关论文、文章和代码资源汇总BERT应用1.NLP - 基于 BERT 的中文命名实体识别(NER)2.参考文献:1.原始论文2.官方github...

2020-01-15 10:53:50 255

原创 时间序列相关学习笔记整理

pandas应用时间序列分析之_时间重采样python时间序列分析之_用pandas中的rolling函数计算时间窗口数据时间序列的平稳性及使用差分法处理非平稳时间序列kaggle比赛:1.时间序列基础建模方法2.Corporación Favorita Grocery Sales Forecastingkaggle教程:1.Time series Basic...

2019-10-30 14:19:52 255

转载 tensorflow 中RNN的正确打开方式

转载:TensorFlow中RNN实现的正确打开方式https://github.com/gaussic/text-classification-cnn-rnnhttps://www.jianshu.com/p/e2f807679290

2019-09-26 09:56:42 117

转载 知识图谱分布式表示模型Trans系列

文章转载:【知识图谱】——8种Trans模型基于翻译模型(Trans系列)的知识表示学习TransE解释

2019-09-25 14:30:12 1156

转载 转载:NLP中预训练发展史

转载:1.从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史2.放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较...

2019-08-28 17:07:42 173

原创 python 单元测试unittest

最近因为项目学习并运用了python的单元测试框架,丰富知识储备。直接上代码,主要是做一个加解密模块的测试,直接上代码# -*- coding: utf-8 -*-import osimport sysfrom Crypto.Cipher import AESfrom Crypto.Hash import SHA256from Crypto import Randomimport...

2019-08-04 21:12:50 322

原创 文本分类textCNN模型理解

借助kaggle比赛https://www.kaggle.com/c/jigsaw-unintended-bias-in-toxicity-classification/overview做些文本分类的总结此次介绍文本分类领域经典模型textCNN,因为结构简单,效果好,提供keras和tensorflow代码供学习相关论文:https://arxiv.org/abs/1408.5882...

2019-07-29 23:43:28 1362

原创 docker-机器学习/深度学习模型部署的容器化方案

目前,使用docker部署机器学习或深度学习模型正在成为企业大规模部署的一种常规操作。基于目前工作的情况,刚好可以使用现成的模型尝试使用docker进行部署。主要有以下1. 什么是docker2. 个性化环境的定制开发-Dockerfile的制作3. docker常用命令4. 模型部署什么是dockerDocker 是一个开源的应用容器引擎,基于 Go 语言 并遵从Apache2.0协...

2019-06-10 21:50:28 5493 5

原创 深度学习系列:资源推荐

深度学习的资料汇总(不定期更新)1. 关于github上最新的论文和对应开源代码的网站:paperswithcode

2019-02-27 10:31:33 187

转载 深度学习系列:Seq2Seq原理及相关案例(附代码)

基于编码-解码(encode-decode)的序列到序列架构序列到序列(Sequence to Sequence)模型是现今序列任务上的王者,如翻译,语音识别等任务上。是现如今深度学习和自然语言处理爱好者必须要掌握的模型。本文将会对最基本的序列到序列模型进行介绍。基本介绍:序列到序列模型代码示例:keras:(一)十分钟搞定Keras序列到序列学习(附代码实现)        ...

2019-02-26 18:00:36 1918

转载 深度学习系列:递归神经网络原理及训练算法(附代码)

递归神经网络(RNN)的算法原理和实现转载:递归神经网络

2019-02-22 17:29:43 1347

转载 深度学习系列:LSTM原理及公式推导(附代码)

深度学习之RNN的变体LSTM原理及数学公式推导转载:零基础入门深度学习(6) - 长短时记忆网络(LSTM)          LSTM Forward and Backward Pass

2019-02-18 15:55:04 1268

转载 深度学习系列:循环神经网络(RNN)

RNN的原理及公式推导转载:零基础入门深度学习- 循环神经网络            当我们在谈论 Deep Learning:RNN 其常见架构            Understanding LSTM Networks ...

2019-01-25 15:53:35 134

转载 深度学习系列:深度学习之Batch Normalization

文章转载:https://zhuanlan.zhihu.com/p/34879333

2019-01-24 11:52:15 120 1

转载 深度学习系列:Dropout原理解析与源码分析

本文转载链接:https://zhuanlan.zhihu.com/p/38200980  

2019-01-16 22:50:25 233

原创 seaborn官方文档学习笔记-第一章(图形美化及样式控制)

        第一章:控制图表样式        本系列笔记是基于seaborn0.8.1版本说明文档进行的翻译。Matplotlib具有高度的可定制性,但很难知道需要调整哪些参数才能实现我们所希望看到的效果。 Seaborn带有一些定制的主题和一个控制matplotlib数字外观的高级界面。%matplotlib inlineimport numpy as npimport matplot...

2018-06-03 22:03:56 2623

原创 运用R和Python进行简单的拉钩网数据分析

因为找工作的关系,爬取了拉钩网上海地区的数据分析师职位,爬取时间是3月13日,爬取代码如下import requestsimport jsonimport timeimport pymysqlimport random# 请求网页def get_html(n): print('开始请求第%d页信息' % n) url = 'https://www.lagou.com/j...

2018-04-10 11:27:38 426

原创 关于爬取图片时遇到下载盗链图的解决方式

在写爬虫爬取图片时,经常会碰到盗链图的产生,无法打开,这是网站设置的反爬机制之一。为了解决这类问题,需要在头文件headers中添加Referer属性值,目的是告诉服务器当前请求是从哪个页面请求过来的'Referer':'网址'Picreferer = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (K...

2018-03-08 16:22:47 2274 2

原创 写入文件中遇到 UnicodeEncodeError: ‘gbk’ codec can’t encode character 错误的解决办法

今天爬网站的内容,在写入TXT文件时,页面总是报UnicodeEncodeError: 'gbk' codec can't encode character '\ufeff' in position 0: illegal multibyte sequence 错误,网上找了半天也没找到解决办法。后来终于找到了解决办法,十分简单:在f = open('test.txt','wt',encoding=...

2018-03-05 00:00:26 4417 4

原创 爬虫实战:爬取微博明星的某一条动态的粉丝评论

2018/2/27,这是我的第一篇博客,写的目的很单纯,就是记录自己学习过程中遇到的问题以及解决方法。初次学习爬虫,本人不才,代码其实也是学习一些B站视频。下面开始爬取的步骤由于是为了爬取粉丝的评论,所以我们的目标就是要找到包含评论的代码,再将其解析并保存下来1.找到代码        爬取的网页是https://m.weibo.cn/status/4160547165300149(鹿晗和关晓彤宣...

2018-02-27 23:01:55 3162 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除