python
文章平均质量分 73
HuntingGo
没有谁生来就是神牛, 而千里之行,始于足下
展开
-
python 群发邮件
一年前写的一个脚本, 通过爬虫技术,将网站页面上出现的email地址给扒下来,然后进行重发邮件, 由于邮箱的安全机制, 可能会进行阻拦(可以考虑怎么避免这样).........附代码:main.py#! /usr/bin/python# -*- coding: utf-8 -*-import re, urllib, sys, SendMailpatt2 =原创 2014-03-30 17:50:49 · 1640 阅读 · 0 评论 -
安装Django环境(nginx+uwsgi + mysql)
1、安装Nginx服务器(此方法来自Nginx官网):sudo add-apt-repository ppa:nginx/stablesudo apt-get updatesudo apt-get install nginx2、安装Django框架(Django采用版本为1.4版本):wget http://www.djangoproject.c转载 2014-06-27 17:35:48 · 1214 阅读 · 0 评论 -
外部python脚本调用django model
django 工程是运行在web server 下得。然而,通常需要开发一个外部的脚本与这个网页工程的model打交道。本文讲诉一个简单的方法去实现,可能不是最好的方法,但毕竟是一个方法。看如下一个简单的例子。可以按照自己的需要去修改,如果你愿意的话。这个例子看起来有点故意做作,但确实能说明我要陈述的东西。假设你有一个自己的博客,用django 开发的。你想定期对老的数据进转载 2015-01-14 21:25:44 · 5042 阅读 · 1 评论 -
网页去噪,获取网页正文相关开源项目
转载自:http://blog.csdn.net/cscmaker/article/details/8841198(1)网页去噪 网页去噪需要去掉与网页内表达内容不相关的文字,如广告,评论等等。现在对于博客、新闻类的网页去噪已经有很多的应用,比如常用的印象笔记、有道笔记就用到了相关的技术。 因为项目的需要,也需要对网页进行去噪,留下有用的内容转载 2015-01-05 11:11:45 · 1180 阅读 · 0 评论 -
Python中的生产者消费者问题
我们将使用Python线程来解决Python中的生产者—消费者问题。这个问题完全不像他们在学校中说的那么难。如果你对生产者—消费者问题有了解,看这篇博客会更有意义。为什么要关心生产者—消费者问题:可以帮你更好地理解并发和不同概念的并发。信息队列中的实现中,一定程度上使用了生产者—消费者问题的概念,而你某些时候必然会用到消息队列。当我们在使用线程时,你可以学习以下的线转载 2015-01-03 11:30:36 · 1013 阅读 · 0 评论 -
Understand Threads in python
We will see some examples of using threads in Python and how to avoid race conditions:You should run each example several times to notice that threads are unpredictable and that your results diffe转载 2015-01-03 11:02:17 · 828 阅读 · 0 评论 -
从url获取域名 python
urllib来解析域名import urllibprint "--"*40for url in urls: proto, rest = urllib.splittype(url) res, rest = urllib.splithost(rest) print "unkonw" if not res else res原创 2015-01-16 11:48:52 · 3620 阅读 · 0 评论 -
关于mmseg分词算法的资料总结
http://www.byywee.com/page/M0/S602/602088.html 关于mmseg的简介https://pypi.python.org/pypi/mmseg/1.3.0 关于mmseg python源码下载https://pypi.python.org/pypi/mmseg/1.3.0 关于mmseg python的简单实现原创 2015-01-13 16:41:59 · 863 阅读 · 0 评论 -
linux下berkeley-db及python binding安装
linux下berkeley-db及python binding安装1, 下载源代码shell > wget http://download.oracle.com/berkeley-db/db-5.3.21.tar.gzshell > wget http://pypi.python.org/packages/source/b/bsddb3/bsddb3-5.3.原创 2015-01-10 20:27:14 · 2288 阅读 · 0 评论 -
python get post模拟请求
1.使用get方式时,url类似如下格式:[html] view plaincopyindex.jsp?id=100&op=bind GET报问头如下:[html] view plaincopyGET /sn/index.php?sn=123&n=asa HTTP/1.1 Accept: */*原创 2014-07-14 17:43:36 · 1540 阅读 · 0 评论 -
Python实现mmseg分词算法和吐嘈
前两天一直在写爬虫,也是一直有心写个简单的搜索引擎吧,写出来肯定是没有Web界面的,本人不知道怎么地,对Web的代码一直有抵触心理。搜索引擎嘛,我想要写出来必须要懂五个部分:1、基础的多线程爬虫2、分词算法,对用户输入的查找文本进行切割3、MapReduce,用来统计词语出现的次数,这个直接关系到URL在队列中的等级4、PageRank,用来给网页排名5、Web界面上述转载 2014-07-26 23:59:23 · 1509 阅读 · 0 评论 -
网络爬虫技术
随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,百度,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如: (1) 不同领域、不同背景的用户往往具有不同的检索目的和需求,通转载 2014-07-27 00:10:56 · 845 阅读 · 0 评论 -
python 网站自动抠图
python 网站自动抠图翻东西, 突然找到了以前用python写的自动下载网站图片的一个脚本很好用, 如果修改的话, 只要将路径改成自己的即可!picdown.py#! /usr/bin/python # -*- coding: utf-8 -*-import urllib2, openurl, sys, urllib, osfilename = r"/原创 2014-03-23 12:55:17 · 5235 阅读 · 0 评论 -
Python cPickle模块
持久性就是指保持对象,甚至在多次执行同一程序之间也保持对象。通过本文,您会对 Python对象的各种持久性机制(从关系数据库到 Python 的 pickle以及其它机制)有一个总体认识。另外,还会让您更深一步地了解Python 的对象序列化能力。什么是持久性?持久性的基本思想很简单。假定有一个 Python 程序,它可能是一个管理日常待办事项的程序,您希望在多次执行这个程序之间可以保转载 2015-11-27 14:28:20 · 771 阅读 · 0 评论