python/java
文章平均质量分 92
overstack
中大研究生喜欢linux后台技术各种架构研究方向是机器学习和数据挖掘
展开
-
Python快速教程
我的朋友问我怎么能快速地掌握python。 我想python包含的内容很多,加上各种标准库,拓展库,乱花渐欲迷人眼,就想写一个快速的,类似于w3cschool风格的python教程,一方面 保持言语的简洁,另一方面循序渐进,尽量让没有背景的读者也可以从基础开始学习。另外,我在每一篇中专注于一个小的概念,希望可以让人可以在闲暇时很快读完。 小提醒 1. 教程将专注于Python基础,语法转载 2013-05-19 01:34:38 · 800 阅读 · 0 评论 -
Python正则表达式指南
本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever。尊重作者的劳动,转载请注明作者及原文地址 >.html1. 正则表达式基转载 2013-06-25 23:29:34 · 803 阅读 · 0 评论 -
zip和*在python中的具体例子
The python docs gives this code as the reverse operation of zip:>>> x2, y2 = zip(*zipped)In particular "zip() in conjunction with the * operator can be used to unzip a list". Can someone explain转载 2013-07-16 21:02:16 · 820 阅读 · 0 评论 -
python中去除全角空格
最近遇到一个需求是要清除中文字串中的全角空格(数据是GBK编码,全角空格的GBK编码是\xa1\xa1)。一开始直接使用str.replace(‘ ’,‘’)来去除,结果是部分结果出现乱码,经过分析,知道了python中的str类是“字节串”,匹配的时候是按照字节进行匹配的,所以如果\xa1\xa1是分布是两个字符之间,也会被去掉,因而导致结果不是我们想要的,比如这个例子:转载 2013-07-02 21:43:34 · 12678 阅读 · 0 评论 -
python routine
http://hi.baidu.com/cwyalpha/item/1600e53678e51349023edc70转载 2013-07-30 13:00:15 · 922 阅读 · 0 评论 -
Turning Vim into a modern Python IDE
ContentsIntroBasic Editing and DebuggingCode FoldingWindow SplitsSnippetsTask listsRevision HistorySyntax Highlighting and ValidationPep8Tab Completion and DocumentationC转载 2013-08-27 20:54:48 · 1544 阅读 · 1 评论 -
Python pdb 简要指南
Python pdb 简要指南pdb常用的启动方式a) 通过 pdb.run 方法:>>> import pdb>>> import mymodule>>> pdb.run('mymodule.test()')b) 命令行参数方式python -m pdb myscript.pyc) 最常用的是将下面一行插入到欲Debug的代码特定位置:转载 2013-09-11 12:07:10 · 965 阅读 · 0 评论 -
Python内存泄露的诊断
Python内存泄露的诊断内存泄露的原因内存泄露的诊断思路内存泄露诊断用到的工具内存泄露诊断的步骤参考文档对于一个用 python 实现的,长期运行的后台服务进程来说,如果内存持续增长,那么很可能是有了内存方面的问题。 在我曾经的一个项目中,就出现了这种内存持续增长的情况,goolge 一下,发现 Tracing Python memory leaks 讲了一种诊断方式转载 2013-09-12 19:43:58 · 2923 阅读 · 0 评论 -
用python写文件输出,解决输出的中文为乱码问题
(1)、python代码文件的编码py文件默认是ASCII编码,中文在显示时会做一个ASCII到系统默认编码的转换,这时就会出错:SyntaxError: Non-ASCII character。需要在代码文件的第一行或第二行添加编码指示:1 # coding=utf-8 ##以utf-8编码储存中文字符2 print '中文'像上面那样直接输入的字符串是按转载 2013-09-12 19:42:47 · 23815 阅读 · 0 评论 -
Python垃圾回收(gc)拖累了程序执行性能?
Python起因前段时间,在做文本处理的实验时,需要预加载大量的原始数据(100W),在Python中使用的字典(dict)类型负责保存这些数据,很快就开发完成 了一个Demo版,然而程序执行的效率不是那么令人满意,通过使用Python中的profile发现,影响程序执行性能的关键语句就那么几条(用 dict保存加载后原始数据,这是个循环遍历。)解决问题既然找到转载 2013-09-12 14:59:55 · 11609 阅读 · 0 评论 -
Python 程序员经常犯的 10 个错误
关于PythonPython是一种解释性、面向对象并具有动态语义的高级程序语言。它内建了高级的数据结构,结合了动态类型和动态绑定的优点,这使得它在快速应用开发中非常有吸引力,并且可作为脚本或胶水语言来连接现有的组件或服务。Python支持模块和包,从而鼓励了程序的模块化和代码重用。关于这篇文章Python简单易学的语法可能会使Python开发者–尤其是那些编程的初学者–忽视转载 2014-05-13 19:07:23 · 7886 阅读 · 0 评论 -
python 中文乱码问题深入分析
一直以来,python中的中文编码就是一个极为头大的问题,经常抛出编码转换的异常,python中的str和unicode到底是一个什么东西呢?在本文中,以'哈'来解释作示例解释所有的问题,“哈”的各种编码如下: 1. UNICODE (UTF8-16),C854; 2. UTF-8,E59388; 3. GBK,B9FE。 一、pytho转载 2014-06-26 18:07:35 · 5270 阅读 · 0 评论 -
Python Advances
关于Python的好文章集锦:1.Top 10 Mistakes that Python Programmers Make2.Advanced Data Structures in Python中文翻译版本:Python高级数据结构3.Introduction to the Python Interpreter中文翻译版本:Python解释器简介4.转载 2014-07-07 12:58:26 · 5528 阅读 · 0 评论 -
python一些有用但是很少人知道的技巧
今天在stack overflow上看到了一个帖子,上面汇集了一些python的隐藏属性,感觉有一些还是挺不错,记录了一些下来:1. 比较符号链接>>> x = 5>>> 1 x 10True>>> 10 x 20 False>>> x 10 x*10 100True>>> 10 > x 9True>>> 5 == x > 4TrueIn原创 2013-07-11 21:14:48 · 912 阅读 · 0 评论 -
如何在python中调用linux命令
工作中经常会用python去调用shell的命令,今天看到了在stack overflow上的一个答案,用到了subprocess的模块,感觉很简单实用,所以分享一下。Look at the subprocess module in the stdlib:from subprocess import callcall(["ls", "-l"])The advantag转载 2013-07-10 23:57:34 · 865 阅读 · 0 评论 -
python的三元运算符
Yes, it was added in version 2.5. It's frowned upon by some pythonistas, so keep that in mind.The syntax is:a if test else bFirst test is evaluated, then either a or b is returned based转载 2013-07-11 00:10:05 · 1111 阅读 · 0 评论 -
java.util.Scanner应用详解
ava.util.Scanner是Java5的新特征,主要功能是简化文本扫描。这个类最实用的地方表现在获取控制台输入,其他的功能都很鸡肋,尽管Java API文档中列举了大量的API方法,但是都不怎么地。 一、扫描控制台输入 这个例子是常常会用到,但是如果没有Scanner,你写写就知道多难受了。当通过new Scanner(System.in)创建一个Sc转载 2013-03-25 00:45:48 · 717 阅读 · 0 评论 -
Python中的列表解析和生成表达式
优雅、清晰和务实都是python的核心价值观,如果想通过操作和处理一个序列(或其他的可迭代对象)来创建一个新的列表时可以使用列表解析( List comprehensions)和生成表达式,通过这两个操作,我们可以看到这三个观点是如何在python中和谐统一起来的。 列表解析 在需要改变列表而不是需要新建某列表时,可以使用列表解析。列表解析表达式为:[expr for转载 2013-05-23 20:27:03 · 913 阅读 · 0 评论 -
Python函数式编程指南(一):概述
这大概算是Python最难啃的一块骨头吧。在我Python生涯的这一年里,我遇到了一些Pythoner,他们毫无例外地完全不会使用函数式编程(有些人喜欢称为Pythonic),比如,从来不会传递函数,不知道lambda是什么意思,知道列表展开但从来不知道用在哪里,对Python不提供经典for循环感到无所适从,言谈之中表现出对函数式风格的一种抗拒甚至厌恶。我尝试剖析这个问题,最终总结了这么转载 2013-05-23 20:51:57 · 629 阅读 · 0 评论 -
Python函数式编程指南(二):函数
这是此系列的第二篇,试图说明在Python中如何更好地使用函数并引导诸位使用函数式的思维进行思考。掌握并应用这些内容,就已经是至少形似的函数式风格的代码了,至于思维么,这个真靠自己。作者水平有限,如有错漏之处还请指出;转载请注明原作者和原地址:)2. 从函数开始2.1. 定义一个函数如下定义了一个求和函数:?12转载 2013-05-23 20:52:48 · 839 阅读 · 0 评论 -
Python函数式编程指南(三):迭代器
这一篇我们将讨论迭代器。迭代器并不是函数式编程特有的东西,但它仍然是函数式编程的一个重要的组成部分,或者说是一个重要的工具。转载请注明原作者和原文地址:)3. 迭代器3.1. 迭代器(Iterator)概述迭代器是访问集合内元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素都被访问一遍后结束。迭代器不能回退,只能往前进行迭代。这并不是什转载 2013-05-23 20:53:24 · 651 阅读 · 0 评论 -
Python函数式编程指南(四):生成器
生成器是迭代器,同时也并不仅仅是迭代器,不过迭代器之外的用途实在是不多,所以我们可以大声地说:生成器提供了非常方便的自定义迭代器的途径。这是函数式编程指南的最后一篇,似乎拖了一个星期才写好,嗯……转载请注明原作者和原文地址:)4. 生成器(generator)4.1. 生成器简介首先请确信,生成器就是一种迭代器。生成器拥有next方法并且行为与迭代器完全转载 2013-05-23 20:55:48 · 709 阅读 · 1 评论 -
Python代码性能优化技巧
Python 代码优化常见技巧代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构、优化、扩展以及文档相关的事情通常需要消耗 80% 的工作量。优化通常包含两方面的内容:减小代码的体积,提高代码的运行效率。改进算法,选择合适的数据结构一个良好的算法能够对性能起到关键作用,因此性能改进的首要点是对算法的改进转载 2013-05-23 22:21:03 · 804 阅读 · 0 评论 -
一些pythonic的代码
I'm pretty sure there should be a more Pythonic way of doing this - but I can't think of one: How can I merge a two-dimensional list into a one-dimensional list? Sort of like zip/map but with more tha原创 2013-05-24 19:37:14 · 878 阅读 · 0 评论 -
python map和list comprehension 效率比较
Is there a reason to prefer using map() over list comprehension or vice versa? Is one generally more effecient or generally considered more pythonic than the other?146down voteacce转载 2013-05-25 10:51:55 · 2143 阅读 · 0 评论 -
python pandas10分钟入门
This is a short introduction to pandas, geared mainly for new users.Customarily, we import as followsIn [1]: import pandas as pdIn [2]: import numpy as npObject CreationSee th原创 2013-05-31 17:07:43 · 9182 阅读 · 0 评论 -
pandas io tools(使用python处理数据时候经常用到)
CSV & Text filesThe two workhorse functions for reading text files (a.k.a. flat files) are read_csv() and read_table(). They both use the same parsing code to intelligently convert tabular data in原创 2013-05-31 17:25:30 · 29029 阅读 · 0 评论 -
python for hadoop 新手入门
发现了一个很好的python for hadoop的入门,适合没有什么hadoop基础的人学习:http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/还有一个也是类似文档:http://cs.smith.edu/dftwiki/index.php/Hadoop_Tutorial_2原创 2013-06-18 20:12:13 · 1499 阅读 · 0 评论 -
10 Most Common Mistakes that Python Programmers Make
About PythonPython is an interpreted, object-oriented, high-level programming language with dynamic semantics. Its high-level built in data structures, combined with dynamic typing and dynamic b转载 2014-07-07 12:58:59 · 5407 阅读 · 0 评论