自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

bensonrachel的博客

欢迎大家来到benson的技术博客。

  • 博客(10)
  • 资源 (2)
  • 收藏
  • 关注

原创 自然语言处理(NLP)- HMM+VITERBI算法实现词性标注(解码问题)(动态规划)(Python实现)

NLP- HMM+维特比算法进行词性标注(Python实现) 维特比算法针对HMM解码问题,即解码或者预测问题(下面的第二个问题),寻找最可能的隐藏状态序列:对于一个特殊的隐马尔可夫模型(HMM)及一个相应的观察序列,找到生成此序列最可能的隐藏状态序列。也就是说给定了HMM的模型参数和一个观测序列,计算一系列的隐状态。给定观测序列,求最可能的对应的隐状态序列。Viterbi:...

2018-11-18 20:42:54 4729 3

原创 关于各种计算机字符编码的笔记

 又一年的七月来了 各种字符编码的出现次序:1.ANSI 的”Ascii”编码;2.GB2312;GB2312 是对 ASCII 的中文扩展;3.GBK;GB2312+20000.4.GB18030:GBK+几千;5.(2.3.4)为DBCS(双字节字符集);6.UNICODE;一个字符两个字节;7.UTF-8;面向传输的每次八个位传输数据。8.UTF-16;同理;...

2018-11-03 14:13:17 606 1

原创 《互联网程序设计(Java)》——课程笔记12:网络安全程序设计二、三(网络数据包捕获与发送程序)

通常情况下网卡(工作在链路层)只往上层(网络层)传递3类包:广播包、与自己IP地址一致的单播包、已加入某组的组播包,在这种情况下,高层应用只能收到上述3类数据包。我们前几讲的程序设计工作,包括基于TCP Socket的网络应用(网络聊天、FTP、Email及HTTP),以及基于UDP Socket的网络聊天应用中,网卡只往网络层传递与自己IP地址一致的单播包。抓包的思想是:流经网卡所有的有效包...

2018-11-30 23:00:19 1884

原创 组网技术—VLAN&TRUNK&VTP

问题: 1 VLAN含义? 把地理位置不在一起的设备逻辑上划分到一起。 2 划分VLAN优点? 管理方便; 安全一、VLAN的定义及特点虚拟局域网(VLAN)是一组逻辑上的设备和用户,这些设备和用户并不受物理位置的限制,可以根据功能、部门及应用等因素将它们组织起来,相互之间的通信就好像它们在同一个网段中一样,由此得名虚拟局域网。静态VLAN(Static ...

2018-11-18 22:20:23 1679

原创 《互联网程序设计(Java)》——课程笔记11:网络安全程序设计一

学会主机及端口等一些基本的网络扫描程序设计技术。目标主机扫描是网络功防的基础和前提,扫描探测一台目标主机包括:确定该目标主机是否活动、目标主机的操作系统、正在使用哪些端口、对外提供了哪些服务、相关服务的软件版本等等,对这些内容的探测就是为了“对症下药”,为攻防提供参考信息。对主机的探测工具非常多,比如大名鼎鼎的nmap、netcat、superscan,以及国内的x-scanner等等。...

2018-11-15 21:52:43 1254

原创 《互联网程序设计(Java)》——课程笔记10:Http程序设计

1、概论HTTP系统包括客户端软件(浏览器)和服务器软件(HTTP服务器)。早期的客户端软件,其主要工作可理解为文件下载和文件显示。实际上现代的HTTP客户端比文件下载要复杂得多,它包括网页文件的下载、跨平台的本地显示,参数的传递,动态网页的实现,以及交互等功能。HTTP系统程序设计包括:(1)   客户端软件(web浏览器软件如IE浏览器、360浏览器)(2)   服务器软件...

2018-11-08 23:08:05 835

原创 python-Rouge_N-评估模型的实现

引用:Rouge(Recall-Oriented Understudy for Gisting Evaluation),是评估自动文摘以及机器翻译的一组指标。它通过将自动生成的摘要或翻译与一组参考摘要(通常是人工生成的)进行比较计算,得出相应的分值,以衡量自动生成的摘要或翻译与参考摘要之间的“相似度”。ROUGE准则由一系列的评价方法组成,包括ROUGE-N(N=1、2、3、4,分别代表基于1...

2018-11-07 21:31:32 4995 1

原创 自然语言处理(NLP)-基于概率最大化的中文分词算法(Java实现)

摘要:平台使用Netbeans搭载JDK1.8环境编程。实现基于概率最大化的中文分词算法并集成于一个窗体平台(如下图)。字典使用WordFrequency.txt;                                    理论描述:最大概率法分词是在最大匹配分词算法上的改进。在某些语句切分时,按最大长度切分词语可能并不是最优切分。而不按最优长度切分词语,则同一语句会出现多...

2018-11-03 14:11:48 2956

原创 《互联网程序设计(Java)》——课程笔记9:邮件发送程序设计

学会网络邮件发送的程序设计技术。     网络程序设计的精髓是什么?   就是客户端和服务器的对话和响应契约(协议)。 简单邮件传输协议SMTP可以很好地诠释这一点。   邮件传输协议包括SMTP(简单邮件传输协议,RFC821)及其扩充协议MIME;   邮件接收协议包括POP3和功能更强大的IMAP协议。25端口(SMTP):25端口为SMTP(Simple Mail Tr...

2018-11-03 10:12:56 1068

原创 python—Rouge(Recall-Oriented Understudy for Gisting Evaluation)

匹配文本评估方法。python实现准确率,召回率X表示模型生成的结果,Y表示运营编辑的结果即reference。多reference的情况,取对应每个reference中最大的rouge-l值作为单个测试数据的结果。LCS 表示最长公共子串。# coding:utf-8''''''import math#输入的两个字符串长度不应为0;def Recall_lcs_G...

2018-11-02 21:20:54 1287

《一个故事带你搞懂ASCII-Unicode字符集和UTF-8编码》

这是一篇写的非常好的故事,带你了解计算机字符编码的前世今生。让人记忆非常深刻,也拿来做过课堂演讲。——《一个故事带你搞懂ASCII-Unicode字符集和UTF-8编码》

2020-11-25

chineseDic.txt

自然语言处理的中文词典,内含6万+的中文标点与中文词。

2018-10-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除