自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 opera 浏览器头 不是opera 打头

opera 浏览器UA头

2017-09-07 12:37:46 1336

原创 [Err] 1055 - Expression #4 of SELECT list is not in GROUP BY clause and contains nonaggregated colum

这个错误发生在mysql 5.7.5 和以后上,因为5.7.5默认的sql模式配置是ONLY_FULL_GROUP_BY, 这个配置启用的是 “严格ANSIsql 规则”,严格ANSI sql 规则要求在group by的时候,没有聚合的列,在group by的时候,必须全部包含在group by 的字段中。没有聚合的列,指的是没有使用 max, min, count,

2017-08-23 15:33:08 19032

原创 爬虫任务设计要有父子概念,即抓取网站和抓取任务的概念

对于抓取任务有个自动统计,原本统计如下,现在需要改成横着来的形式由于一个网站分成了,市场价,出厂价的抓取,所有么有一个父子关系的话,不好统一起来。。还是要像之前想的设计一样,有个父子关系,网站最大,然后网站下面可以有多个任务一个网站可以对应多个任务

2017-08-18 15:26:17 459

原创 python str方法转换为字符串 对于Unicode会调用系统默认编码

一个很神奇问题是,在对一个Unicode字符串,如a = “国产药品(2017)年” 进行 str(a) 操作的时候,在windows 上没问题,但是回去用mac再来运行的时候发现就报错了,ascii can not encoding...同时我还在windows下直接进行了  unicode_str.replace("中文空格", "")也是在windows下成功被替

2017-08-08 10:41:51 549

原创 python的str()对于unicode来说并不等于encode utf-8 不能简写

上一篇文章说错了。。。str 方法相当于 unicode.encode("utf-8") 是有前提条件的。。。这个前提条件就是:  预先设置了Python的内部编码为utf-8,也就是执行了>>> import sys>>> reload(sys)>>> sys.setdefaultencoding("utf-8")也就是说,str 的编码,实际上是 缺省使用了内部默

2017-08-07 23:11:24 2542

原创 scrapy xpath 然后extract返回的是unicode类型, 可以考虑转换为utf-8或者其他编码类型

遇到了这样一个问题。在scrapy中,通过启动时候传入settings控制抓取范围如scrapy crawl spiderName -s crawl_target=食品然后在parse里面xpath找出来区域,判断 settings.crawl_target =? xpath.extract()但是一直比较不出来,即使 食品 = 食品 这样两个print出来一样,但是 食品

2017-08-07 19:55:54 6994 2

原创 python str方法 等于执行encode utf-8 无论是在ipython还是原生Python

对于unciode 类型来说,对他执行一次 str() 相当于执行unciode.encode("utf-8")无论是在linux还是在windows如图所示代码如下>>> import sys>>> reload(sys)>>> sys.setdefaultencoding("utf-8")>>>>>> a = u"中">>>>>> au'

2017-08-07 19:47:59 6233

原创 python的两种不同print print , 加逗号和print "%s %s" 不一样

对于两种实际结果显示一样的写法print a,b 和 print "%s %s" 他们两个内部其实是不一样的。。。print a,b 我认为相当于调用 print a 然后print b 然后 print c,每次都单独执行了一个print而print "%s %s" % (a,b) 就是一次执行完,只执行了一次print为什么这样说 ??在windows环境下

2017-08-07 15:18:53 17582 1

原创 python 动态引入模块 importlib 和 __import__ 不一样

如图所示,应该推荐使用 importlib 的方式。scrapy 的源码也正是使用的这种方式附scrapy 源码中 scrapy/utils/misc.py 中引入源码的load_object 实现def load_object(path): """Load an object given its absolute object path, and return i

2017-08-04 10:04:37 2661

原创 更改源码解决 sphinx make html utf-8codec can't decode

sphinx 在windows上,make html 的时候...又坑爹的给我报'utf8' codec can't decode 这种编码错...我就知道 外国佬写的东西,就是不考虑我们汉字使用者的感受,特别是Python这块追踪来源到\anaconda\lib\ntpath.py", line 85, in join    result_path = result_path +

2017-07-31 17:42:15 651

原创 Python编码检测 chardet 效果不如 UnicodeDammit

实际例子还是上一篇文章的http://www.angenechemical.com/productshow/AGN-PC-0JCLT7.html在scrapy中,记录下response的body的时候,self.logger.error(response.body) 会报无数的错经过手工尝试 decode("gbk"), decode("gb2312"), encode

2017-07-27 09:57:20 3988 1

原创 python 检查编码chardet 并非有效

样例网址如下:http://www.angenechemical.com/productshow/AGN-PC-0JCLT7.html用Python请求这个网站,并且让logger 记录请求到的body def parse(self, response): try: result = {} for

2017-07-26 18:01:13 1318

原创 python 数据库首字母大写 mysql 不区分大小写

不处理大小写写入到数据库会有什么问题 ???数据库会给你报错:Duplicate column name 'Concentration(Argentmetric titration)'然而实际上我写入

2017-07-17 11:18:04 1245

原创 python UnicodeDecodeError 更改logging 源码解决

Python UnicodeDecodeError logger

2017-07-12 12:48:23 3095

原创 多进程同步问题,python多进程解读

先贴上代码吧,后续再补上文章。。进程不能用全局变量,因为新进程一启动的就会先把全局变量执行一遍,所以你全局的进程锁是完全没用的,只能传参数传进去#coding=utf-8##测试一个进程在写文件的时候,另外一个文件能不读#import multiprocessing,time"""测试结果,with 的锁对进程完全没用  只对线程有用

2016-03-20 21:50:58 701

原创 选择排序和插入排序的区别

首先来看牛客网的一道笔试题    问这段代码是 选择排序还是插入排序。怎么判断呢,这里先给出结论。     数据交换swap发生在while,for 等循环里面的是 『插入排序』,在循环外的,是『选择排序』。     为什么会有这个结论呢?我们把插入排序和选择排序代码全写出来对比,一看就知道了。#include int swap(int *a,int *b) {

2016-02-25 16:56:18 1432

转载 Java中的static关键字解析

Java中的static关键字解析  static关键字是很多朋友在编写代码和阅读代码时碰到的比较难以理解的一个关键字,也是各大公司的面试官喜欢在面试时问到的知识点之一。下面就先讲述一下static关键字的用法和平常容易误解的地方,最后列举了一些面试笔试中常见的关于static的考题。以下是本文的目录大纲:  一.static关键字的用途  二.static关键字的误区  三.常见

2015-12-30 16:26:15 286

原创 Java IO速度和占用内存的极致优化方法,模板方法【从hdu 2602 说起】

谈起java,给人的第一映像是什么?除了简单方便易上手,跨平台可移植,各种函数库支持类应有尽有不用重复造轮子这些特性之外,恐怕就是速度慢,占用内存高了吧。不可否认,java运行速度和内存占用方便确实无法比肩C/C++。随手举一个很直观的栗子,在ACM等其他算法竞赛中,普通给java的代码运行的时间往往都是C和C++  2~~3倍,由此可见一斑。不过我们今天要说的就是,算法效率一样的情况下,如何去优

2015-11-16 14:48:14 5217 1

原创 php 的哲学和python的哲学

php 的哲学和python的哲学: 函数执行失败php是返回一个bool值false,那么的话,代码就可以优雅成这样 "执行 xxx or die("失败") "  ;  而对于python来说,执行失败却是抛出异常。。。那么你不得不对异常进行处理。。。

2015-08-27 10:53:54 540

原创 python 批量重命名

ilde 不知道动到哪里了,.py 现在出不来 『idle编辑的选项』,pyw 倒是有 == 百度了半天发现还要改注册表,于是作罢, pyw 和 py 效果一样,既然pyw 有右键选项,那就把原来的后缀改一下就好了,也是一样的效果import ospath = os.getcwd()for root,dirs,files in os.walk(path): for i in

2015-08-06 13:46:17 347

转载 【转】设计模式

简单工厂模式解释:        简单工厂模式(Simple Factory Pattern)属于类的创新型模式,又叫静态工厂方法模式(Static FactoryMethod Pattern),是通过专门定义一个类来负责创建其他类的实例,被创建的实例通常都具有共同的父类。简单工厂模式的UML图:        简单工厂模式中包含的角色及其相应的职责如下:     

2015-07-25 09:26:06 277

转载 java中AWT和SWing的区别与联系

先附上百度知道的回答,知道个大概java awt和swing有什么区别?跟本地系统的相关性。。JDK写程序 所有功能都是靠虚拟机去操作本地操作系统 比如window下。。就是JDK用windows API实现你功能而awt包中很多组件是组件自身去调用本地操作系统代码swing包中的组件 采用的是调用本地虚拟机方法,由虚拟机再调用本地操作系统代码。。意

2015-07-03 20:53:29 1076

原创 数据库操作: 查询选修了所有课程的学生

先给出sql 代码:select sno, snamefrom studentswhere not exists( select * from course where not exists( select * from sc where sno =

2015-06-10 15:48:58 8055

原创 #盘点买完后最想剁手的东西#

『三天前又脑抽了,买来甘草和菊花泡水喝 == 喝着喝着发现问题了。。杯子太小不过瘾,不如买个大点的杯子 == 嗯,既然要大的那就干脆点,买个巨大的  结果一脑抽,最大的杯子都不满足==干脆买了个锅    是的,我看    这个锅样子就不错,挺像杯子的,如果用来倒水喝一定不会一下子就没了 Orz  卖家听我说买这货是来当杯子喝水就愣住了 == 估计也是头一回见我这傻逼客户,于是推荐我买了这一款专

2015-06-09 20:59:37 1074

转载 http-equiv是什么意思(转载)

1.定义语言 格式: 〈meta http-equiv=〃Content-Type〃 content=〃text/html; charset=gb2312〃〉 这是META最常见的用法,在制作网页时,在纯HTML代码下都会看到它,它起的作用是定义你网页的语言,当访客浏览你的网页时,浏览器会自动识别并设置网页中的语言,如果你网页设置的是GB码,而访客没有安装GB码,这时网页只

2015-04-15 20:03:10 544

转载 python 多线程就这么简单

多线程和多进程是什么自行google补脑  对于python 多线程的理解,我花了很长时间,搜索的大部份文章都不够通俗易懂。所以,这里力图用简单的例子,让你对多线程有个初步的认识。 单线程   在好些年前的MS-DOS时代,操作系统处理问题都是单任务的,我想做听音乐和看电影两件事儿,那么一定要先排一下顺序。(好吧!我们不纠结在DOS时代是否有听音乐和

2015-04-12 20:05:19 472

转载 window下(或Ubuntu下)Sublime Text 2.01注册码license key

点击help输入license key[plain] view plaincopyprint?----- ----- BEGIN LICENSE  Alexander  Single User License  EA7E-814345  51F47F09 4EAB1285 7827EFF0 8B1207DC  A76A6EA3 E1A1CA7A DC

2015-04-06 14:47:47 516

原创 ZOJ 1089 Lotto 请叫我循环狂魔 ! 六重循环AC

在这里说一句,这题的输出真蛋疼。。。因为输出的问题PE 了5次。  要把每一次案例输出的结果,额外多一个换行与其他的区别开来,但是最后一个以 0 结束输入的,他之前不能有换行。#include#include#include using namespace std;//int fac(int n)//{// int ans=1;// for(int i=1

2015-04-05 14:18:46 409

原创 六战HDU1241 Oil Deposits 对搜索的不断反思

第一战:结果: PKU 顺利AC  HDU 死都是 WA  这就郁闷了。。。#include #include #include #include #include using namespace std;typedef struct node{ int x; int y;}node;void BFS(int i,int j,ch

2015-04-02 19:08:56 455

原创 bool 与 int

在做搜索的时候,会用到标记已经访问过的数组 visited[ ][ ]  visited 就两种状态,访问过;没有访问过;  因此除了int 定义之外,还可以使用bool 类型定义,而且bool 类型省空间,比int 少了四倍

2015-04-02 16:31:38 636

原创 由 Oil Deposits 反思 程序中数组越界的重大隐患

Oil Deposits   搜索入门水题。。。好久没打C++  结果还卡了。。。惭愧惭愧   先给出AC代码#include #include #include #include #include using namespace std;typedef struct node{ int x; int y;}node;void BFS(int i

2015-04-01 23:46:41 287

原创 unicode、utf-8 各种字符编码的自我解读

由于计算机只能认识 0 ,1   所有文件都是以 0,1 的形式的在计算机中保存的。 因此,我们所使用的语言文字 ,标点符号表情就没办法直接存储 。因此就需要对我们的语言文字标点符号进行编码,编成0,1 的形式   一一对应保存   比如 0100 0001  的存储就是表示大写 'A' ;   0100 0010 就是表示大写 'B'    非常不错的主意,把字母和能0,1 一一对应起来了。

2015-01-27 12:34:47 444

转载 【已解决】windows下,安装python的chardet

最简单方便快捷的方法就是: 下载.egg 的安装包。。。改后缀为zip 直接解压放进去就好了。。。    第一次的时候下的就是.egg 的,但是不知道怎么打开,就去官网下.zip  安装的时候提示错误。。。 找啊找   终于找到了这篇教程。。。文章转载于: http://download.csdn.net/download/aqwd2008/4256178另可参考: http://

2015-01-24 19:09:37 640

原创 作为一个理工男,我是怎么分段搭火车回去省100的。。。

全文太长。。。没多少人有耐心用手机看完吧 先在前面大致说一下什么情况: 我要从 长沙 回 深圳,去年还能买学生票的,今年却不行了。。。忽略高铁回去的话,普通火车报价是 280 多,长沙---> 深圳,这对坐惯了学生票的我来说,还没适应过来,这时理工男的特性就出来了,尝试着做了一次动态数学规划,希望能减少一下我回去的花费  。我希望同时兼顾  舒适 和 经济 两个原则,做出一个最优的

2015-01-11 21:30:27 1795

转载 【转载】 汇编语言考前总结

题外话:学好汇编,建议大家看王爽老师的《汇编语言》 清华大学出版社 图书配套网站 汇编网:http://www.asmedu.net/ 讨论氛围非常好。JRH的汇编网博客(卖弄一下呵呵):http://www.asmedu.net/blog/user/usermain.jsp?neighborId=39135---------------------------------

2014-12-28 19:44:53 1398

原创 树的三种遍历方式 白话解读 + 波兰表达式为例

在数据结构中,树有三种b

2014-10-24 01:19:52 2701 2

转载 四个程序员的一天 【转载】

你,一个DotNet程序员,刚刚加入一个新项目组。除了你之外,其他的成员包括:Ceer,一直从事C项目的程序员,他刚刚转入C#不到一个月; Jally,整天抱着本Design Pattern(没错,就是GoF的那本)在啃的前Java程序员;以及Semon,你对他完全不了解,只是听PM介绍说他是搞Scheme的(传说中的第二古老的语言LISP的方言之一)。不过你也没在意,毕竟计算机这玩意,老东西是不

2014-10-15 18:56:26 385

转载 程序员在 5 月 20 日这天有什么特别的表白方式? 【转载】

转载来自 : 点击打开链接昨天在知乎回答了一个问题,程序员在 5 月 20 日这天有什么特别的表白方式?,几天无意中发现,已经获得 200 多的赞同了,特来CSDN 与广大程序员朋友分享。---------------------------------------------------表白嘛,当然 69 了。呵呵,先不要邪恶。99669999996669999996

2014-10-15 18:40:59 869

转载 程序员之路——一个老程序员对刚上大学的学弟学妹的忠告 【转载】

转载来自:点击打开链接

2014-10-15 18:20:27 438

转载 1997世界编程第一名作品[转载]

转载Nazgul的,这玩意果断神了。。e100 33 f6 bf 0 20 b5 10 f3 a5 8c c8 5 0 2 50 68 13 1 cb e 1f be a1 1 bf 0 1e11b 6 57 b8 11 1 bb 21 13 89 7 4b 4b 48 79 f9 ad 86 e0 8b c8 bd ff ff e8 20e134 0 3d 0 1 74 1a

2014-10-15 18:12:31 336

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除