python相关
文章平均质量分 93
say_c_box
小白不能不努力~
展开
-
python入门教程&学习笔记
python学习笔记本篇笔记根据python简明教程中觉得值得注意的地方摘取而成基本概念4种类型的数——长整数,整数,浮点数,负数。三引号可以表示多行的字符串,三引号中可以自由的使用单引号和双引号python中用到的任何东西都称之为对象,使用变量时只需要给它们赋一个值。不需要声明或定义数据类型。控制流if语句注意if语句在结尾处包含一个冒号——我们通过它告诉Python下面跟着一个语句块。原创 2017-05-23 14:33:54 · 1031 阅读 · 2 评论 -
python中的filter函数
filter函数本质上是一个过滤函数,从一个序列中筛选出你需要的函数。 其参数是一个函数和一个序列,把传入的函数以此作用于每个参数,根据返回值确定是否保留。比如从一个序列中筛选出奇数def is_odd(n): return n % 2 == 1 a=[1,2,3,4,5,6] a = filter(is_odd, a) print a比如从一个字典序列原创 2017-05-25 10:57:43 · 1927 阅读 · 0 评论 -
使用python的Flask实现一个简单RESTful API服务器端
找了一篇教程学习了一下,为了加深印象照着写了一遍存下来,原文链接如下:传送门REST的六个特性Client-Server:服务器端与客户端分离。Stateless(无状态):每次客户端请求必需包含完整的信息,换句话说,每一次请求都是独立的。Cacheable(可缓存):服务器端必需指定哪些请求是可以缓存的。Layered System(分层结构):服务器端与客户端通讯必需标准化,服务器的变更转载 2017-05-25 15:53:46 · 5176 阅读 · 0 评论 -
基于python实现的mmseg中文分词算法实现及其优化
mmseg中文分词算法的python实现及其优化mmseg算法理解mmseg本质上个人理解就是前向最大匹配+消除歧义规则+贪心,最简单的前向最大匹配就是,将每次从起点位置能匹配到的最长词语作为分词结果,连续进行下去。前向最大匹配符合人们的习惯,但是在某些语句中会产生歧义。例如北京大学生前来应聘,由于北京大学在词库中出现,所以前向最大匹配会分成北京大学/生/前来/应聘,显然这不是正确的分词结果。那么m原创 2017-11-07 00:08:17 · 1135 阅读 · 0 评论 -
python实现的基于hmm模型的词性标注系统
python实现的基于hmm模型的词性标注系统任务定义实现一个词性标注系统,输入分好词的单词序列,输出一个词性标注后的结果序使用的语料库为人民日报98年公开语料库,一共约18000行语料。在用户交互模式下,所有语料库均用作训练。在文件读写模式下,前3000行语句用来做测试,后面的语句用来做训练。方法描述隐马尔科夫模型理解隐马尔科夫模型是结构最简单的动态贝叶斯网络。描述由一个隐藏的马尔科夫链随机生成原创 2017-11-16 14:16:58 · 10641 阅读 · 6 评论 -
mmseg中文分词算法的python实现及其优化
mmseg中文分词算法的python实现及其优化任务定义实现一个中文分词系统并对其性能做测试。输入输出该分词的训练语料取自人民日报1998年公开的语料库。为了保证测试的严谨性,选择另一份语料库做测试文档。该文档为SIGHAN(国际计算语言学会(ACL)中文语言处理小组)举办的国际中文语言处理竞赛中提供的pku_test_gold语料。方法描述mmseg算法理解mmseg本质上就是前向最大匹配+消除歧原创 2017-11-16 14:23:31 · 2644 阅读 · 1 评论 -
用python从一个单词列表中快速生成word_to_ix字典
#set函数创建一个无序不重复的元素集,可进行关系测试,删除重复数据。还可以计算交集,差集,并集。vocab = set(test_sentence)#enumerate函数用于将一个可遍历的数据对象组合为一个索引序列。同时列出数据和数据下标。word_to_ix = {word: i for i, word in enumerate(vocab)}原创 2017-12-19 22:04:11 · 2048 阅读 · 0 评论