自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

语言浮云,数学王道

基础解疑/数据采集/数据分析/建站

  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

转载 xpath and regular expression

xpathxpath以非常底层的实现而闻名于世,大部分源代码是用 C 语言写的。正则表达式:尽量避免在html全文本中直接使用计算机科学里曾经有个笑话:“如果你有一个问题打算用正则表达式( regular expression)来解决,那么就是两个问题了。”

2016-11-08 14:22:32 446

原创 pycharm 基本的快捷键使用

pycharm的快捷键使用标记:红色标记比较常用CTRL Q: 在参数列表位置,显示可以输入的所有参数。CTRL + 鼠标左键 快速调到指定函数阅读CTRL -: 折叠当前代码CTRL +: 展开当前代码CTRL SHIFT -: 折叠所有代码CTRL SHIFT +: 展开所有代码CTRL SHIFT F7: 将当前单词在整个文件中高亮,F3移动到下一个,ES

2016-10-11 12:01:14 2746

原创 初识python PIL与pytesser

1、关于安装pytesser,安装前要安装PIL,具体的文件下载可以翻墙到官网去值得注意的问题是尽量保持一致,譬如windows下的PIL为32位的(PIL-1.1.7.win32-for-python2.7.exe)所以Python的版本也尽量装32位的,不然可以会遇到麻烦。pytesser直接解压在Python27\Lib\site-packages\文件夹下即可2、初步认

2016-07-11 23:42:53 658

原创 三叉哈夫曼树的分析

要讲解三叉哈夫曼树之前,你得弄懂一下几个问题:1、什么是二叉哈夫曼树2、二叉哈夫曼树是什么类型的算法3、在2中的算法构建出三叉或者N叉哈夫曼树一定是最优的吗?以上的问题我就不给予具体的answer,其实二叉哈夫曼树就应用了贪心算法,对于该算法不熟悉的同学赶紧去补补书贪心算法无法保证全局最优,而是提供了局部最优的一种解决方法。(当然证明为最优的贪心策略就可以的,前

2016-07-08 09:16:11 10043 1

原创 python实现螺旋矩阵的填充

afanty的分析:关于矩阵(二维数组)填充问题自己动手推推,分析下两个下表的移动规律就很容易咯。对于螺旋矩阵,不管它是什么鬼,反正就是依次向右、向下、向右、向上移动。向右移动:横坐标不变,纵坐标加1向下移动:纵坐标不变,横坐标加1向右移动:横坐标不变,纵坐标减1向上移动:纵坐标不变,横坐标减1代码实现:#coding=utf-8import nu

2016-06-23 15:12:08 2887

原创 Python爬虫入门之request函数定制

爬虫入门 -  定制合适的请求函数(以下代码仅供参考和学习使用,勿非法使用,thx)#coding=utf-8import timeimport randomfrom requests.exceptions import *from requests import request'''example:options = { 'method':'get',

2016-06-18 14:31:09 727

原创 【代码】Python冒泡排序的实现

afanty分析:对于N个数的递进冒泡排序1、趟数是 N-1 趟2、第 i 趟的比较次数是 N-i 次3、两两比较前者大于(注意不是大于等于,冒泡是稳定的)后者则交换。改进的话就是增加一个交换记录器(数),每趟检查下记录器,如果没发现交换则表示已经有序。我上面的表述是为了方便写代码,详细的冒泡介绍可以百度下,下面是实现的代码:(注意的一个问题是,对象的引用问

2016-06-15 23:15:44 607 1

原创 [教程]Python 求解任意闭区间的所有素数

题目:请求出任意区间[a,b]的所有素数,简单考虑实用性这道题看起来应该很easy是吧,但任意区间(这个问题有没get 到)Afanty的分析:1、首先明白什么叫素数,注意用求余法判断的循环上限应该为sqrt(n)吧?2、任意区间,a,b是不是可以为负数、小数等。所以是不是要首先对区间下限向上取整、区间上限向下取整,得到新的区间[a,b]再判断呀:如何判断?

2016-06-14 15:08:50 1831

原创 Python实现N阶台阶的走法问题

题目:一栋楼有N阶楼梯,兔子每次可以跳1、2或3阶,问一共有多少种走法?Afanty的分析:遇到这种求规律的问题,自己动动手推推就好,1阶有几种走法?2阶有几种走法?3阶有几种走法?4阶有几种走法?5阶有几种走法?对吧,规律出来了!易错点:这不是组合问题,因为第1次走1阶、第2次走2阶不同于 第1次走2阶、第2次走1阶下面是Python的递归实现代码,希望对

2016-06-12 01:33:25 6580

原创 mysql从csv文件导入数据时提示int类型出现' '(空字符串)

最新在导入一些历史数据做数据分析时,发现出现int类型出现' '(空字符串)的错误问了度娘也没结果,到stack overflow 问了下外国朋友成功解决囖,这样的问题应该很少见,所以我也就不做过多的解释,直接看mysql语句(红色部分已经标出)#新建表drop table if exists src_estate_building_info;create table 

2016-06-12 00:31:37 2725

原创 linux定时任务之crontab命令

在Ubuntu下部署了几个基本spider,每天定时去claw最新的SUV交易数据简单点就直接crontab拉起脚本,写点笔记也方便兴趣者照葫芦画瓢,首先确保系统已经安装了crontab。crontab 的使用进入crontab -e编辑a退出esc 然后 :wq简单举例*/20 * * * * cd /alidata/spide

2016-06-11 23:17:53 581

原创 ubuntu环境下python爬虫项目需要的模块

端午假期逛了下ubuntukylin社区,发现里面的掌声不少。所以我这个爱国爱党爱美眉的三好青年也装了最新版的ubuntukylin。由于之前阿里云机器是centos,所以有些Python的模块还得重装下,以下是一些模块的安装和出现相关问题的解决方法(备注:大天朝的网络,所以建议还是翻翻墙)脚本依赖的python模块与安装方法如下,验证方法import + module

2016-06-11 23:05:08 517

原创 python类变量和实例变量之真相

首先请看下以下一段代码:class Test(object): num_of_instance = 0 def __init__(self, name): self.name = name Test.num_of_instance += 1 # endif __name__ == '__main__': print Te

2016-06-11 18:35:50 445 1

原创 Python 函数返回值

新手在写函数时往往记得发回他们想要的结果,而其他情况不做要求,譬如:下面一段代码当参数a的值大于零时交换a,b的值def swap(param_a, param_b) : ''' :param param_a: :param param_b: :return: ''' if param_a > 0 : param_a,par

2016-06-11 15:45:14 2805

原创 Python学习资料推荐

为了方便兴趣者快速入门,下面推荐了一些web资源和已经出版的书籍。建议英语能力比较好的,优先看英文版,因为很多都是翻译过来的,难免会出现很多问题,尤其是一些标准库的翻译和框架的翻译!养成良好的英文阅读习惯也有利于优先接触新的知识。另外,有空也可以泡泡国外的Stack Overflow(http://stackoverflow.com/)。基础部分:1、廖雪峰

2016-06-10 20:39:31 493

转载 Python 读取键盘输入 区别input()与raw_input()

Python提供了两个内置函数从标准输入读入一行文本,默认的标准输入是键盘。如下:raw_inputinputraw_input函数raw_input([prompt]) 函数从标准输入读取一个行,并返回一个字符串(去掉结尾的换行符):#!/usr/bin/python# -*- coding: UTF-8 -*- str = raw_input("请输入:")

2016-06-10 16:46:50 41908

原创 Python 字典KeyError

>>> dict_test = dict(a='apple', b='bear')>>> dict_test['a']'apple'>>> dict_test['c']Traceback (most recent call last): File "", line 1, in dict_test['c']KeyError: 'c'>>> 思考下如何运行下 dict_

2016-06-09 14:53:18 3469

原创 python IDE(python 集成开发环境) pycharm必用配置

我从开始学习Python就是用pycharm开发,当然可能有不少的coder用sublime text, 萝卜青菜各有所爱呗,譬如,pycharm在单步调试爬虫时、版本控制、代码跳转等都是很实用的。pycharm软件可以通过官网获得安装, 磨刀不费砍柴功,进行配置下是很有必要的,让开发过程更加舒服(1)设置行号(File->Settings->Editor->Appearance)

2016-06-09 14:15:27 5432 1

原创 python2 浮点数操作常见“陷阱”

(1)刚接触Python2进行除法运算可能会感动很奇怪:>>> 3/21>>> 10/33>>> 结果为整数?思考了一会,你可能会这样改进>>> float(3)/21.5>>> float(10)/33.3333333333333335>>> 恩恩,这样的确解决了少数部分被"抛弃"的现象,但float(10)/3这样的精度可能不是你希望的。这里给你推

2016-06-09 00:08:58 897

广州大学城特色书店管理系统

在开发图书销售系统时,需要具备下面的开发环境:操作系统:Windows7。Java开发包:JDK 7.0。数据库:SQL Sever 2008。开发工具:Eclipse。

2015-04-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除