python
韩大帅666
无时无刻都需要激励自己努力
展开
-
Python 3 语法小记(一)入门 (print 函数用法总结)
[python] view plain copy print? 写了一年C++后来自学python,真是不太习惯,总感觉有点别扭,还是写博客记记语法,不然一下子就忘了,新手一个,只能一边学一边写,然后四处找找资料o(╯□╰)o在 Python 3 中接触的第一个很大的差异就是缩进是作为语法的一部分,这和C++等其他语言确转载 2017-09-12 17:31:20 · 332 阅读 · 0 评论 -
Python分布式redis数据处理
数据处理后保存在mongodb中#!/usr/bin/env python# -*- coding:utf-8 -*-import redisimport pymongoimport jsondef process_item(): # 创建redis数据库连接 rediscli = redis.Redis(host = "127.0.0.1", port = 6379原创 2018-01-23 13:33:21 · 888 阅读 · 0 评论 -
找xpath好用的工具(Firefox插件)
WebDriver Element Locator安装打开firefox浏览器,进入网址https://addons.mozilla.org/en-US/firefox/在搜索框里输入WebDriver Element Locator 点击Add to firefox 会有个弹出框,点击install now可以看从firefox浏览器的menu -> Tools -> A转载 2018-01-17 14:42:30 · 5840 阅读 · 0 评论 -
Python 一个爬虫的案例
#coding=utf-8import urllib2import reclass Spider: """ 内涵段子爬虫类 """ def __init__(self, page, enable): self.page = page self.enable = enable def loadPage(self原创 2018-01-08 17:16:17 · 7102 阅读 · 1 评论 -
Python爬去贴吧图片
# tieba_xpath.py#coding=utf-8#!/usr/bin/env python# -*- coding:utf-8 -*-import osimport urllibimport urllib2from lxml import etreeclass Spider: def __init__(self): self.tiebaNam原创 2018-01-09 10:23:43 · 369 阅读 · 0 评论 -
Tesseract-OCR的简单使用与训练
Tesseract-OCR的简单使用与训练Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开转载 2018-01-10 15:59:10 · 689 阅读 · 0 评论 -
redis知识点与Python的交互
NoSQL简介NoSQL,全名为Not Only SQL,指的是非关系型的数据库随着访问量的上升,网站的数据库性能出现了问题,于是nosql被设计出来优点/缺点优点:高可扩展性分布式计算低成本架构的灵活性,半结构化数据没有复杂的关系缺点:没有标准化有限的查询功能(到目前为止)最终一致是不直观的程序分类类型部分代表特点列存储HbaseCassandraHypertable顾名思义,是按列存储数据的。原创 2018-01-19 12:11:49 · 299 阅读 · 0 评论