自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 NLP理论基础和实践(进阶)task 6

Attention原理目前大多数的注意力模型都是依附在 Encoder-Decoder 框架下,但并不是只能运用在该模型中,attention机制作为一种思想可以和多种模型进行结合,其本身不依赖于任何一种框架。Encoder-Decoder 框架是深度学习中非常常见的一个模型框架,例如在 Image Caption 的应用中 Encoder-Decoder 就是 CNN-RNN 的编码 - 解...

2019-08-19 09:52:56 241

原创 深度学习中的正则化

正则化正则化是选择模型的一种方法,具体来说,选择经验风险与模型复杂度同时较小的模型(防止过拟合),这样可以较少泛化误差而不是训练误差。常用正则化方法参数范数惩罚:L1正则化、L2正则化; 数据集增强; 噪声添加; early stop; Dropout层1、参数范数惩罚参数范数惩罚通过对目标函数JJ添加一个参数范数惩罚Ω(θ)Ω(θ),限制模型的学习能力。将正则...

2019-08-11 20:47:24 256

原创 NLP理论基础和实践(进阶)-word2vec

语言模型在统计自然语言处理中,语言模型指的是计算一个句子的概率模型。传统的语言模型中词的表示是原始的、面向字符串的。两个语义相似的词的字符串可能完全不同,比如“番茄”和“西红柿”。这给所有NLP任务都带来了挑战——字符串本身无法储存语义信息。该挑战突出表现在模型的平滑问题上:标注语料是有限的,而语言整体是无限的,传统模型无法借力未标注的海量语料,只能靠人工设计平滑算法,而这些算法往往效果甚...

2019-08-09 20:38:28 256

原创 NLP理论基础和实践(进阶)数据集探索 01

1.tensorflow安装推荐Anaconda(针对自己操作系统和位数下载对应版本);推荐用conda create创建对应的python环境(注:某些python版本可能不支持tensorflow);通过pip install来安装tensorflow。参考:tensorflow安装教程http://www.tensorflownews.com/series/tensorf...

2019-08-07 20:51:50 189

原创 微信小程序

   在用微信开发一个抽取新年签的小活动时,学习到了微信的分享过程: 微信上有个demo实例,有需要的朋友,可以到关于微信jssdk上下载。 $jssdk = new JSSDK("微信公众号ID", "微信公众号秘钥"); $signPackage = $jssdk->GetSignPackage(); 将这两句话,写在想要进行分享的那一页,并在该页的script中写入 ...

2018-07-22 17:04:52 113

转载 php处理敏感词时遇到的相关编码问题

敏感词,一方面是我国网监限制,另一方面是我们自己可能也要过滤一些人身攻击或者广告信息等,具体词库可以google下,有很多。过滤敏感词,使用简单的循环 str_replace 是性能很低效的,还会随着词库的增加,性能指数下降,而且简单的替换,不能解决一些不是完全匹配的词。这时候就需要先构建一个字典树(trie),单纯的字典树占用空间较大,使用 Double-Array Trie 或者 Ternar...

2018-07-22 17:03:24 280

转载 nginx中的location

location匹配的是nginx的哪个变量?$request_urilocation的匹配种类有哪些?格式 location [ 空格 | = | ~ | ~* | !~ | !~* ] /uri/ {}# 精确匹配: 相等(=)# 字符串匹配: 字符串匹配(空格) 匹配开头(^~)# 正则匹配: 区分大小写匹配(~) 不区分大小写匹配(~*) 区分大小写不匹配(!~)

2017-06-06 17:55:46 292

原创 json_encode转码过程中遇到的问题

解决json_encode中遇到的问题

2017-02-21 22:02:47 1057

转载 【php中的curl】php中curl的详细解说

这几天在帮一些同学处理问题的时候,突然发现这些同学是使用file_get_contents()函数来采集页面内容的,貌似都没有curl的概念亦或是对这种工具特别不敏感,本文我来给大家详细介绍下cURL的简单的使用方法,下文我将会给大家详细介绍cURL的高级应用,好,废话不多说,我们先来认识下什么是cURL,可能还有很多同学没有听说过这个工具,我先来给大家简单介绍下什么是cURL:

2017-02-09 21:57:38 330

转载 php处理敏感词时遇到的相关编码问题

在过滤敏感词这一块,由于敏感词数量较多,这时候就需要先构建一个字典树(trie),单纯的字典树占用空间较大,使用 Double-Array Trie 或者 Ternary Search Tree 可以在保证性能的同时节省一部分空间,但是敏感词基本不会很多,几千甚至上万个词基本没压力,所以就实现就选择先构建一个字典树,然后逐字做匹配。 class SensitiveWordFilter

2017-02-02 17:00:51 492

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除