python
NS西北风
为梦想而坚持。
展开
-
python标准库学习
1 输入python来测试是否安装python 2我觉得两种方式 : ./test.py(有执行权限) python test.py原创 2013-10-27 23:30:58 · 819 阅读 · 0 评论 -
用NLTK处理自己的文件
>>> import nltk>>> from nltk.corpus import BracketParseCorpusReader>>> corpus_root = r"C:\Program Files\360\360zip\LiveUpdateLog">>> file_pattern = r".*.log">>> ptb = BracketParseCorpusReader(原创 2013-11-08 16:44:25 · 3937 阅读 · 0 评论 -
python自然语言处理学习笔记第二章第二部分
>>> from nltk.corpus import brown>>> cfd = nltk.ConditionalFreqDist((genre,word) for genre in brown.categories() for word in brown.words(categories=genre))>>> cfd.items()[(原创 2013-11-09 08:54:58 · 1897 阅读 · 1 评论 -
python自然语言处理学习笔记第三章
从本章开始往后我们的例子程序将假设你以下面的导入语句开始你的交互式会话或程序:>>> from __future__ import division>>> import nltk, re, pprint读取网络上存储的数据:>>> from __future__ import division>>> import nltk,re,pprint>>> from u原创 2013-11-09 10:19:30 · 1996 阅读 · 0 评论 -
python中添加自己py文件所在的目录的方法
方法一:方法2:原创 2013-11-09 10:42:41 · 2894 阅读 · 0 评论 -
python自然语言处理学习笔记第三章2
为了读取本地文件,我们需要使用Python 内置的open()函数,然后是read()方法。另一个你在访问一个文本文件时可能遇到的问题是换行的约定,这个约定因操作系统不同而不同。内置的open()函数的第二个参数用于控制如何打开文件.。'r'意味着以只读方式打开文件(默认),'U'表示“通用”,它让我们忽略不同的换行约定。>>> f = open('C:\pythonfile\原创 2013-11-09 11:18:01 · 3225 阅读 · 0 评论 -
字符编码笔记:ASCII,Unicode和UTF-8
[出自]http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。下面就是我的笔记,主要用来整理自己的思路。但是,我尽量试图写得通俗易懂,希望能对其转载 2013-11-10 21:52:45 · 998 阅读 · 0 评论 -
python自然语言处理学习笔记第三章3
对Python 解释器而言,一个正则表达式与任何其他字符串没有两样。如果字符串中包含一个反斜杠后面跟一些特殊字符,Python 解释器将会特殊处理它们。例如:“\b”会被解释为一个退格符号。一般情况下,当使用含有反斜杠的正则表达式时,我们应该告诉解释器一定不要解释字符串里面的符号,而仅仅是将它直接传递给re 库来处理。我们通过给字符串加一个前缀“r”来表明它是一个原始字符串。例如:原创 2013-11-10 23:30:59 · 1694 阅读 · 0 评论 -
python自然语言处理学习笔记第三章4
保留所有词首或词尾的元音序列。在下一个例子中,正则表达式匹配词首元音序列,词尾元音序列和所有的辅音;其它的被忽略。>>> import nlktTraceback (most recent call last): File "", line 1, in import nlktImportError: No module named nlkt>>> import n原创 2013-11-12 10:10:39 · 1978 阅读 · 0 评论 -
python服务器和客户端网络通讯UDP
#!/usr/bin/pythonfrom socket import *HOST='localhost'PORT=21567BUFSIZ=1024ADDR=(HOST,PORT)udpCliSock = socket(AF_INET,SOCK_DGRAM)while True:data = raw_input('>')if not data:breakudpCliSock.sendto(data原创 2013-10-24 14:13:44 · 1108 阅读 · 0 评论 -
pytho网络通信服务器端和客户端建立通信
#! /usr/bin/pythonfrom socket import *HOST='localhost'PORT = 21567BUFSIZ = 1024ADDR = (HOST,PORT)tcpCliSock = socket(AF_INET,SOCK_STREAM)tcpCliSock.connect(ADDR)while True:data = raw_input('>')if not原创 2013-10-23 22:02:08 · 822 阅读 · 0 评论 -
python服务器和客户端网络通讯socketserver
#!/usr/bin/pythonfrom socket import *HOST='localhost'PORT=21567BUFSIZ=1024ADDR=(HOST,PORT)while True: tcpCliSock = socket(AF_INET,SOCK_STREAM) tcpCliSock.connect(ADDR) data=raw_input('>')原创 2013-10-24 14:17:55 · 1160 阅读 · 0 评论 -
python自然语言处理学习笔记第二章
1 NLTK 包含古腾堡项目(Project Gutenberg)电子文本档案的经过挑选的一小部分文本。该项目大约有25,000(现在是36,000 了)本免费电子图书,放在http://www.gutenberg.org/上。我们先要用Python 解释器加载NLTK 包,然后尝试nltk.corpus.gutenberg.fileids(),下面是这个语料库中的文件标识符:>>> nlt原创 2013-11-08 14:21:19 · 3225 阅读 · 0 评论 -
python自然语言处理学习笔记第一章第二部分
>>> sent1=['fdasdf','fdgdf','qwfdge','dfeger']>>> for xyzzy in sent1: if xyzzy.endswith('e'): print xyzzy qwfdge>>> tricky = sorted([w for w in set(text2) if 'cie' in w or 'cei' in w])原创 2013-11-08 11:47:14 · 2654 阅读 · 0 评论 -
python学习小结
sys.path python的模块搜索路径集。sys.path.append(path) 把自己的路径添加到搜索路径下。 .打开和关闭文件(open(),file(),close())fileObj = open(filename,access_mode='r',buffering=-1) 使用完文件后,一定要记得关闭文件 f.close().fil原创 2013-10-27 22:38:21 · 759 阅读 · 0 评论 -
【转】python下载网页图片代码
# -*- coding:utf-8 -*-import httplibimport urllibimport stringimport redef getContent(): #从网站中获取所有内容conn = httplib.HTTPConnection("tu.duowan.com")conn.request("GET", "/转载 2013-10-27 22:55:48 · 1129 阅读 · 0 评论 -
python学习笔记
1>>> import sys>>> logfile=open('home/huangcd/mylog.txt','a')Traceback (most recent call last): File "", line 1, in ?IOError: [Errno 2] No such file or directory: 'home/huangcd/mylog.txt'原创 2013-10-28 09:44:30 · 1527 阅读 · 0 评论 -
python学习笔记2
1 文件的读写操作>>> def myRange(r):... i = 0... while i ... yield "%s\n" %i... i +=1... f = open("writelines_generator_function_outfile","w") File "", line 6原创 2013-10-31 10:56:45 · 1170 阅读 · 0 评论 -
python标准库1
glob是python自己带的一个文件操作相关模块,用它可以查找符合自己目的的文件,就类似于Windows下的文件搜索,支持通配符操作,*,?,[]这三个通配符,*代表0个或多个字符,?代表一个字符,[]匹配指定范围内的字符,如[0-9]匹配数字。它的主要方法就是glob,该方法返回所有匹配的文件路径列表,该方法需要一个参数用来指定匹配的路径字符串(本字符串可以为绝对路径也可以为相对路径),其返回原创 2013-11-18 09:52:56 · 1242 阅读 · 0 评论 -
python脚本读取邮件,有错。
#!/usr/bin/env pythonimport poplibusername = 'huang_303513'password = '*******'mail_server = 'mail.163.com'p = poplib.POP3(mail_server)p.user(username)p.pass_(password)for msg_id in p.list原创 2013-11-04 16:48:36 · 771 阅读 · 0 评论 -
python批量导出导入MySQL用户的方法
详细出处参考:http://www.jb51.net/article/43294.htm#!/usr/bin/env python#-*-encoding:utf-8-*-#-------------------------#name: mysql_usr_dump.py#Purpose: 批量导出用户#Author: huangchengdu原创 2013-11-18 20:35:51 · 1685 阅读 · 0 评论 -
今天晚上敲得python命令
Python 2.7.2 (default, Jun 12 2011, 15:08:59) [MSC v.1500 32 bit (Intel)] on win32Type "help", "copyright", "credits" or "license" for more information.>>> import os>>> os.getcwd()'C:\\Program原创 2013-11-19 20:54:14 · 2356 阅读 · 0 评论 -
python实现各种排序算法
在Python实践中,我们往往遇到排序问题,比如在对搜索结果打分的排序(没有排序就没有Google等搜索引擎的存在),当然,这样的例子数不胜数。《数据结构》也会花大量篇幅讲解排序。之前一段时间,由于需要,我复习了一下排序算法,并用Python实现了各种排序算法,放在这里作为参考。最简单的排序有三种:插入排序,选择排序和冒泡排序。这三种排序比较简单,它们的平均时间复杂度均为O(n^2),在这里对转载 2013-11-06 11:01:10 · 684 阅读 · 0 评论 -
python自然语言处理工具NLTK各个包的意思和作用总结
【转】http://www.myexception.cn/perl-python/464414.html 【原】Python NLP实战之一:环境准备最近正在学习Python,看了几本关于Python入门的书和用Python进行自然语言处理的书,如《Python编程实践》、《Python基础教程》(第2版)、《Python自然语言处理》(影印版)。因为以前是学Java的,有着良好转载 2013-11-07 23:40:20 · 23573 阅读 · 0 评论 -
python自然语言处理学习笔记第一章
1 找出文件中以ing结尾的文字In [5]: for line in open("regular_express.txt"): for word in line.split(): if word.endswith('ing'): ...: print word ...: ...:原创 2013-11-07 17:34:20 · 5876 阅读 · 0 评论 -
正则表达式练习
#!/usr/bin/env pythonfrom random import randint,choicefrom string import lowercasefrom sys import maxintfrom time import ctimedoms=('com','edu','net','org','gov')for i in range(randint(5,10))原创 2013-10-30 16:09:26 · 1024 阅读 · 0 评论