- 博客(6)
- 收藏
- 关注
原创 python作业|齐夫定律、平均多义性
题目(1):P82.第23题.齐夫定律:f(w)是自由文本中词w的频率。假设一个文本中的所有词都按照它们的频率排名,频率最高的排在最前面。齐夫定律指出一个词类型的频率与它的排名成反比(即f*r=k,k是某个常数)。例如:最常见的第50个词类型出现的频率应该是最常见的第150个词类型出现频率的3倍。a) 写一个函数来处理一个大文本,使用pylab.plot画出相对于词的排名的词的概率,你认可齐夫定律吗?(提示:使用对数刻度会有帮助。)所绘的线的极端情况是怎样的?b) 随机生成文本,如:使用random.
2020-06-03 10:24:17 1242
原创 使用crf++工具进行分词训练
1.将语料处理成CRF++工具要求的格式train.txt的格式如下:(使用4tab,BEMS,字与标注之间以“\t”间隔,一个字一行。当然,这里还涉及到将空格切分的文本处理成标签的问题。可参考:https://blog.csdn.net/juanjuan1314/article/details/78892855)迈 B向 E充 B满 E希...
2019-08-15 14:35:46 521 1
原创 Java实现UDP协议
1.定义UDP(User Datagram Protocol):用户数据报协议TCP (Transmission Control Protocol):传输控制协议上层应用的两个不同的运输层协议。UDP概述:UDP是无连接的。UDP使用尽最大努力交付。UDP没有拥塞控制。UDP是面向报文的。UDP支持一对一、多对多、多对一和多对多的交互通信2.UDP协议发送数据发送处理过程...
2019-05-08 21:52:43 2176 1
原创 ubuntu下安装editplus
1.首先要安装winesudo apt-get updatesudo apt-get install wine记得update,不然可能会出错。安装的时间会比较长,遇到这里时,tab键选择确定。2.下载最新版的editplus:wget ftp://ftp.editplus.com/ep3setup.exe3.使用wine安装:wine ./ep3setup.exe会有图...
2019-05-08 19:06:17 1717
原创 细数Ubuntu下安装mysql和workbench我踩过的坑
最终安装成功的教程:http://www.cnblogs.com/zhuyp1015/p/3561470.html安装过程:1. sudo apt-get install mysql-server2. apt-get isntall mysql-client3. sudo apt-get install libmysqlclient-dev结果我在第二句代码就又出现很迷的问题!!...
2018-10-18 23:13:22 3684 2
原创 pyhanlp的使用(在python里调用hanlp分词包)
Pyhanlp的使用(在python里调用hanlp分词包)这是我第一次写博客,写的不好,请多多见谅。1.在python下安装pyhanlpsudo pip install pyhanlp 详见pyhanlp官方文档链接:https://pypi.org/project/pyhanlp/0.1.26/2.pyhanlp的一些使用方法(1)Hanlp.segment的使用。fro...
2018-07-26 19:59:42 15911 5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人