python
叶过无痕
这个作者很懒,什么都没留下…
展开
-
python正则表达式
1. Python 正则式的基本用法1.1 基本规则1.2 重复1.2.1 最小匹配与精确匹配1.3 前向界定与后向界定1.4 组的基本知识2. re 模块的基本函数2.1 使用 compile 加速2.2 match 和 search2.3 finditer2.4 字符串的修改与替换3. 更深入的了解 re 的组与对象3.1 编译后的转载 2015-11-04 09:21:58 · 827 阅读 · 0 评论 -
批量查询URL是否被收录(Python多线程)
#coding=utf-8import urllib,urllib2,re,randomdef get_proxies(): html = urllib2.urlopen('http://www.xici.net.co/nn/').read() pa = re.compile(r'(\d+.\d+.\d+.\d+)[\s\S]+?(\d+)[\s\S]+?')转载 2015-12-03 11:33:28 · 1506 阅读 · 0 评论 -
简单暴力:关键词自动分类
import jiebaclass fenlei: def __init__(self,kwpath="keyword.txt",stpath="stop.txt",top=2): self.cipin = {} self.fenci = {} self.stop = [word.decode("gbk").strip("原创 2015-12-03 11:35:47 · 1919 阅读 · 0 评论 -
百度关键词挖掘代码(python无限循环版,挖词百万so easy 8月1日更新)
#coding=utf-8import urllib2, re, urllibdef shangq(key): pattern = re.compile(r'"word":"([^"]+)","total":(\d+)') url = 'http://shangqing.baidu.com/recomword/recomWordCache_fin转载 2015-12-03 11:34:40 · 1173 阅读 · 0 评论 -
Python 练习册,每天一个小程序
第 0000 题:将你的 QQ 头像(或者微博头像)右上角加上红色的数字,类似于微信未读信息数量那种提示效果。 类似于图中效果第 0001 题:做为 Apple Store App 独立开发者,你要搞限时促销,为你的应用生成激活码(或者优惠券),使用 Python 如何生成 200 个激活码(或者优惠券)?第 0002 题:将 0001 题生成的 200 个激活码(或者优惠翻译 2016-08-05 09:32:13 · 1439 阅读 · 0 评论 -
基于k-means和tfidf的文本聚类代码简单实现
俗话说“外行看热闹,内行看门道“,作为一个机器学习的门外汉,刚研究python机器学习scikit-learn两周时间,虽然下面这段程序可能对于那些专研算法或机器学习的人来说非常简单,但对于一些入门的同学和我自己还是非常有帮助的。如果文章中有错误或不足之处,还请你微微一笑,原谅之;当然也非常欢迎你提出建议或指正~基本步骤包括: 1.使用python+selenium分析d转载 2017-08-16 16:48:10 · 18434 阅读 · 3 评论 -
Win10下python3和python2同时安装并解决pip共存问题
特别说明,本文是在Windows64位系统下进行的,32位系统请下载相应版本的安装包,安装方法类似。使用python开发,环境有Python2和 python3 两种,有时候需要两种环境切换使用,下面提供详细教程一份。1、下载python3和python2进入python官网,链接https://www.python.org/选择Downloads--->Wind...转载 2019-05-30 13:07:19 · 201 阅读 · 0 评论