快速学会Python(实战)

一:学习感悟

(0)学习语言思想和观念的转变是关键 —— 感触分享

 乐于善于接受新鲜事物,对新知识充满渴求的欲望;

多交朋友,你可能会做到一门技术一门语言的大牛,你不可能门门精通,互相学习;

参见技术交流群 和 技术blog和社区,之后自己再钻研官方的API

开启一门新技术的策略:1)从一个感兴趣的点入手(培养兴趣),运行一些小示例;2)1-2天简单的过一下基本的语言(可以不变代码);3)1-2天开始把教程里面的一些小程序,自己手动敲一遍;4)2-3天把此语言的数据类型以及包装类型的(类似STL)的方法应用一下,调试一下;5)高级进阶以及高级应用;6)总结,总结贯穿始终

(1)接着上一篇Blog写

二:Python类类型详解

(1)函数:Python函数
函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。
1)定义一个函数你可以定义一个由自己想要功能的函数,以下是简单的规则:
函数代码块以def关键词开头,后接函数标识符名称和圆括号()。
任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。
函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。
函数内容以冒号起始,并且缩进。
Return[expression]结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None(最好显示的写上return)。

2)按值传递参数和按引用传递参数
所有参数(自变量)在Python里都是按引用传递。如果你在函数里修改了参数,那么在调用这个函数的函数里,原始的参数也被改变了。
3)不定长参数
你可能需要一个函数能处理比当初声明时更多的参数。这些参数叫做不定长参数,和上述2种参数不同,声明时不会命名。基本语法如下:
def functionname([formal_args,] *var_args_tuple ):
   "函数_文档字符串"
   function_suite
   return [expression]
加了星号(*)的变量名会存放所有未命名的变量参数。选择不多传参数也可。
4)匿名函数
用lambda关键词能创建小型匿名函数。这种函数得名于省略了用def声明函数的标准步骤。
Lambda函数能接收任何数量的参数但只能返回一个表达式的值,同时只能不能包含命令或多个表达式。
匿名函数不能直接调用print,因为lambda需要一个表达式。
lambda函数拥有自己的名字空间,且不能访问自有参数列表之外或全局名字空间里的参数。
虽然lambda函数看起来只能写一行,却不等同于C或C++的内联函数,后者的目的是调用小函数时不占用栈内存从而增加运行效率。
lambda函数的语法只包含一个语句,如下:
lambda [arg1 [,arg2,.....argn]]:expression

(2)Python 模块 (就是.py文件(.java 文件) 以及 java里面的包)
模块让你能够有逻辑地组织你的Python代码段。把相关的代码分配到一个 模块里能让你的代码更好用,更易懂。
模块也是Python对象,具有随机的名字属性用来绑定或引用。
简单地说,模块就是一个保存了Python代码的文件。模块能定义函数,类和变量。模块里也能包含可执行的代码。
1)当你导入一个模块,Python解析器对模块位置的搜索顺序是:
当前目录
如果不在当前目录,Python则搜索在shell变量PYTHONPATH下的每个目录。

如果都找不到,Python会察看默认路径。UNIX下,默认路径一般为/usr/local/lib/python/
模块搜索路径存储在system模块的sys.path变量中。变量里包含当前目录,PYTHONPATH和由安装过程决定的默认目录。
2)import 语句  想使用Python源文件,只需在另一个源文件里执行import语句,语法如下:
import module1[, module2[,... moduleN]
当解释器遇到import语句,如果模块在当前的搜索路径就会被导入。
搜索路径是一个解释器会先进行搜索的所有目录的列表。如想要导入模块hello.py,需要把命令放在脚本的顶端:

#coding=utf-8
#!/usr/bin/python
# 导入模块
import support
# 现在可以调用模块里包含的函数了
support.print_func("Zara")
以上实例输出结果:
Hello : Zara
3)一个模块只会被导入一次,不管你执行了多少次import。这样可以防止导入模块被一遍又一遍地执行。
From…import 语句
Python的from语句让你从模块中导入一个指定的部分到当前命名空间中。语法如下:
from modname import name1[, name2[, ... nameN]]
例如,要导入模块fib的fibonacci函数,使用如下语句:
from fib import fibonacci
这个声明不会把整个fib模块导入到当前的命名空间中,它只会将fib里的fibonacci单个引入到执行这个声明的模块的全局符号表。

4)一个Python表达式可以访问局部命名空间和全局命名空间里的变量。如果一个局部变量和一个全局变量重名,则局部变量会覆盖全局变量。
每个函数都有自己的命名空间。类的方法的作用域规则和通常函数的一样。
Python会智能地猜测一个变量是局部的还是全局的,它假设任何在函数内赋值的变量都是局部的。因此,如果要给全局变量在一个函数里赋值,必须使用global语句。
global VarName的表达式会告诉Python, VarName是一个全局变量,这样Python就不会在局部命名空间里寻找这个变量了。
例如,我们在全局命名空间里定义一个变量money。我们再在函数内给变量money赋值,然后Python会假定money是一个局部变量。然而,我们并没有在访问前声明一个局部变量money,结果就是会出现一个UnboundLocalError的错误。取消global语句的注释就能解决这个问题。
(3)Python中的包
包是一个分层次的文件目录结构,它定义了一个由模块及子包,和子包下的子包等组成的Python的应用环境。
考虑一个在Phone目录下的pots.py文件。这个文件有如下源代码:

#coding=utf-8
#!/usr/bin/python
def Pots():
   print "I'm Pots Phone" 
同样地,我们有另外两个保存了不同函数的文件:
Phone/Isdn.py 含有函数Isdn()
Phone/G3.py 含有函数G3()
现在,在Phone目录下创建file __init__.py:
Phone/__init__.py
当你导入Phone时,为了能够使用所有函数,你需要在__init__.py里使用显式的导入语句,如下:
from Pots import Pots
from Isdn import Isdn
from G3 import G3
当你把这些代码添加到__init__.py之后,导入Phone包的时候这些类就全都是可用的了。
#coding=utf-8
#!/usr/bin/python
# Now import your Phone Package.
import Phone
Phone.Pots()
Phone.Isdn()
Phone.G3()
以上实例输出结果:
I'm Pots Phone
I'm 3G Phone
I'm ISDN Phone
如上,为了举例,我们只在每个文件里放置了一个函数,但其实你可以放置许多函数。你也可以在这些文件里定义Python的类,然后为这些类建一个包。

三:简单实战

(1)list(链表数组) tripule元祖(元素不可变)string 和 函数 异常处理 文件读取(好)

# coding=utf-8
#!/usr/bin/python

print " *********just for test file i/o******";	
try:
	fileR = open('splits.txt','r');
	done = 0;
	while not done:
		f_str = fileR.readline();
		if (f_str != ''):
			eles = f_str.split(',');
			#print "eles:",eles;
			for ele in eles:
				print ele;
		else:
			done = 1;
except IOError:
	print "Error:can\'t find this file";
fileR.close();

print " *********just for test file i/o compare for above method ******";	
try:
	fileR = open('splits.txt','r');
	f_lines = fileR.readlines();
	for line in f_lines:
		eles = line.split(',');
		#print eles.pop(); #默认删除最后一个元素
		#print len(eles); # list的元素个数
		for ele in eles:
			if(ele[-1] == '\n'):
				ele = ele[:-1]; #截取从开头到 倒数第一个字符(倒数第一个去掉)
			print ele;
except IOError:
	print "Error:can\'t find this file";
fileR.close();

print " *********just for operate list******";

list = ['physics', 'chemistry', 1997, 2000];
# append 追加元素 自添加多少倍
list = list + ['zyp','xqz'];
list = list*3;
print "list: ", list;
# 通过下标截取,删除
print "list[1:4] [eles): ",list[1:4];
print "len(list[1:4]: ", len(list[1:4]);
print "list[-2]:", list[-2];
print "list[:4]:", list[:4];
print "list[2:]:",list[2:];
del list[8:-1];
print "after del list[8:-1]: ", list

print "list.pop(): ",list.pop();
print "list.count('zyp'): ", list.count('zyp');

print " *********just for operate string******";
#续行符
line = "I am zyp, from HKU,\
my name is Minzhang.\
Welcome my zoon!\a";
print line;
#自连接 多少倍
line = line*3;
# find() count() len() index() 下标取值
print "line.count('zyp',2,len(line)-1):  ",line.count('zyp',2,len(line)-1);
print "substr: ", line[line.find('zyp',2,15):line.find('zyp')+len('zyp')];
# replace() splite()分隔
print "line.replace('zyp','cxt'):", line.replace('zyp','cxt');
words = line.split(',');
for word in words:
	print word;

print "********line or lines****"
lines = '''
I am zyp, from HKU,
my name is Minzhang.
Welcome my zoon!
''';
print lines;
errHTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
''';
print errHTML;

print "********dict_hash****";
dict_hash = {'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'};
print "dict_hash['Beth']: ", dict_hash['Beth'];
#insert or add
dict_hash['name'] = 'zyp';
print "dict_hash['name']:",dict_hash['name'];
#change the value by key
dict_hash['name'] = 'cxt';
#get the all keys and traversal
keys = dict_hash.keys();
for key in keys:
	print key,"-->",dict_hash.get(key);
# change from hash to vector
items = dict_hash.items();
for item in items:
	print item;
print "dict_hash.has_key('cxt'):", dict_hash.has_key('cxt'),"; dict_hash.has_key('name')", dict_hash.has_key('name');

print "********function test****";
#匿名函数的声明和调用
sum = lambda arg1,arg2:arg1 + arg2;
print "Value of total sum(10,20)", sum(10,20);
print "Value of total sum(20,20)", sum(20,20);
#可写函数说明 和 不定长参数
def printinfo(arg1,*vartuple):
	"打印任何传入的参数"
	print "output:";
	print arg1;
	for var in vartuple:
		print var;
	return;
printinfo(10);
printinfo(70,60,50);

print "***********try except********";
# 自定义异常 使用raise语句自己触发异常
class NetworkError(RuntimeError):
	def __init__(self,arg):
		self.args = arg;
try:
	raise NetworkError("Bad hostname");
except NetworkError,e:
	print e.args;
	print str(e);
except "Invalid levele!":
	print "Invalid levele!";
finally:# 对出try时总会执行
	print "can\'t find ";
prompt = "***********Module 模块就是.py文件********";
print prompt.decode('gbk').encode('utf8');#cao 这都不行,中文还是乱码,真是无语了
# 若去掉global就不对啦
Money = 2000;
def AddMoney():
	"想改正代码就取消以下注释"
	global Money;
	Money = Money + 1;
	print Money;
	return;
print "before recall AddMoney:", Money;
AddMoney();
print "after recall AddMoney:", Money;

(2)时间操作

import time
from time import strftime
import calendar
#coding=utf-8
#!/usr/bin/python

print "**********test time (import)********"
#design the time by format
def getDateByFormat(localtime):
	"指定格式化的时间 %Y-%m-%d %H:%M:%S"
	# format the time from time import strftime
	data_time = strftime( '%Y-%m-%d %H:%M:%S', localtime);
	print "formatting local current time : ", data_time;
	return data_time;
	
# design the time by yourself
def getTime(localtime):
	"获取时间 时分秒"
	hour = str(localtime.tm_hour);
	mins = str(localtime.tm_min);
	sec = str(localtime.tm_sec);
	return (hour + "时" + mins + "分" + sec + "秒");

def getDate(localtime):
	"获取日期 年月日"
	year = str(localtime.tm_year);
	mon = str(localtime.tm_mon);
	day = str(localtime.tm_mday);
	return (year + "年" + mon + "月" + day + "日");
def getWeekday(localtime):
	"获取星期几"
	weekday = ('星期一','星期二','星期三','星期四','星期五','星期六','星期七');
	weekcnt = localtime.tm_wday;
	return weekday[weekcnt-1];

def getDataByDesign(localtime):
	"获取完整的时间,按照自定义的格式获取"
	data_time = getDate(localtime) + " " + getTime(localtime) + " " + getWeekday(localtime);
	return data_time;

# 函数测试
localtime = time.localtime(time.time());
print "Local current time : ", localtime;
#调养函数
newtime = getDateByFormat(localtime);
print "系统格式化的时间:", newtime;
newtime = getDataByDesign(localtime);
print "自定义格式化的时间:", newtime;

print "**********test Calendar********";
mon = calendar.month(2015,4,3,2);#calendar.month(year,month,w=2,l=1)
print "Here is the calendar(one month):";
print mon;

y = calendar.calendar(2015,w=2,l=1,c=6)#calendar.calendar(year,w=2,l=1,c=6)
print "Here is the calendar(one year):";
print y;

(3)xml文件解析

#coding=utf-8
#!/usr/bin/python

import xml.sax
# 继承语法 class 派生类名(基类名)://... 基类名写作括号里,基本类是在类定义的时候,在元组之中指明的。     
class MovieHandler( xml.sax.ContentHandler ):
   def __init__(self):
      self.CurrentData = ""
      self.type = ""
      self.format = ""
      self.year = ""
      self.rating = ""
      self.stars = ""
      self.description = ""

   # 元素开始事件处理
   def startElement(self, tag, attributes):
      self.CurrentData = tag
      if tag == "movie":
         print "*****Movie*****"
         title = attributes["title"]
         print "Title:", title

   # 元素结束事件处理
   def endElement(self, tag):
      if self.CurrentData == "type":
         print "Type:", self.type
      elif self.CurrentData == "format":
         print "Format:", self.format
      elif self.CurrentData == "year":
         print "Year:", self.year
      elif self.CurrentData == "rating":
         print "Rating:", self.rating
      elif self.CurrentData == "stars":
         print "Stars:", self.stars
      elif self.CurrentData == "description":
         print "Description:", self.description
      self.CurrentData = ""

   # 内容事件处理
   def characters(self, content):
      if self.CurrentData == "type":
         self.type = content
      elif self.CurrentData == "format":
         self.format = content
      elif self.CurrentData == "year":
         self.year = content
      elif self.CurrentData == "rating":
         self.rating = content
      elif self.CurrentData == "stars":
         self.stars = content
      elif self.CurrentData == "description":
         self.description = content
  
if ( __name__ == "__main__"):
   
   # 创建一个 XMLReader
   parser = xml.sax.make_parser()
   # turn off namepsaces
   parser.setFeature(xml.sax.handler.feature_namespaces, 0)

   # 重写 ContextHandler
   Handler = MovieHandler()
   parser.setContentHandler( Handler )
   
   parser.parse("movies.xml")
   
   
def foo(bar=[]):        # bar是可选参数,如果没有指明的话,默认值是[]
	bar.append("MKY");    # 但是这行可是有问题的,走着瞧…
	return bar;
print foo()
print foo()

odd = lambda x : bool(x % 2)
nums = [n for n in range(10)]
nums[:] = [n for n in nums if not odd(n)]  # 啊,这多优美
print nums
(4)类的继承 和 文件读取

# encoding: utf-8
#!/usr/bin/python
import re

class Parent:
	parentAttr = 100;
	# 重载
	def __init__(self):
		print "调用父类构造函数 Parent construct".decode("utf-8").encode("gbk");
	#成员函数
	def parentMethod(self):
		print "调用父类成员函数:Parent method";
	def setAttr(self,attr):
		Parent.parentAttr = attr;
	def getAttr(sef):
		print "父类属性:ParentAttr:", Parent.parentAttr;
	def __del__(self):
		print "parent descontruct";
	
	
class Child(Parent): # 定义子类
	def __init__(self):
		print "调用子类构造方法 child construct"

	def childMethod(self):
		print '调用子类方法 child method'
	def __del__(self):
		print "child destructor";

c = Child()          # 实例化子类
c.childMethod()      # 调用子类的方法
c.parentMethod()     # 调用父类方法
c.setAttr(200)       # 再次调用父类的方法
c.getAttr()  


lines = "zyp,0001,nan\r\nxqz,0002,nan\r\nwzx,0003,nv";
line = "Cats are smarter than dogs";
matchObj = re.match( r'(.*),', lines, re.M|re.I)

if matchObj:
	print "ddd", matchObj.group();
else:
	print "no match!!";
lists = lines.split(',\\r\\n');
print "lists:",lists;

for li in lists:
	print li;
	#print li,"\n";

print " *********just for test******";	
try:
	fileR = open('splits.txt','r');
	done = 0;
	while not done:
		f_str = fileR.readline();
		if (f_str != ''):
			eles = f_str.split(',');
			#print "eles:",eles;
			for ele in eles:
				print ele;
		else:
			done = 1;
except IOError:
	print "Error:can\'t find this file";
fileR.close();

print " *********just for test******";	
try:
	fileR = open('splits.txt','r');
	f_lines = fileR.readlines();
	for line in f_lines:
		eles = line.split(',');
		for ele in eles:
			print ele;
except IOError:
	print "Error:can\'t find this file";
fileR.close();

(0)目录

快速学Python 和 易犯错误(文本处理)

Python文本处理和Java/C比对

十分钟学会Python的基本类型

快速学会Python(实战)

大数据处理之道(十分钟学会Python)

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 机器学习实战Python基于支持向量机(SVM)是一种强大的分类器算法。SVM是一种监督学习方法,可以用于解决二分类和多分类问题。 SVM的基本思想是找到一个最佳的超平面,将数据分割成不同的类别。超平面被定义为在n维空间中具有n-1维的子空间。这个子空间可以将不同类别的数据点分开,并且尽可能地最大化边界。这就意味着SVM在分类时尽量避免误分类,并且对于新的未知数据具有较好的泛化能力。 在Python中,我们可以使用scikit-learn库中的SVM实现机器学习任务。首先,我们需要导入必要的库和数据集。然后,我们可以对数据集进行预处理,如特征缩放和数据划分。接下来,我们可以创建一个SVM分类器,并使用训练数据进行模型的训练。训练完成后,我们可以使用测试数据进行预测,并评估模型的性能。 SVM还有一些重要的参数需要调节,如C和gamma。C表示惩罚项的权重,用于控制分类器的错误率和边界的平衡。较大的C值会减小错误率,但可能导致边界过拟合。gamma表示径向基函数核的参数,影响分类器的决策边界的灵活性。较大的gamma值会导致边界更加精确地拟合训练数据,但可能导致过拟合。 总的来说,机器学习实战Python基于支持向量机(SVM)是一个强大的分类器算法,可以用于解决二分类和多分类问题。在实际应用中,我们需要注意调节参数,使得分类器具有良好的泛化能力。 ### 回答2: 机器学习实战是一本非常实用的书籍,其中详细介绍了如何使用Python编程语言基于支持向量机(SVM)进行机器学习实践。 支持向量机是一种强大的监督学习算法,可以用于解决分类和回归问题。该算法通过寻找一个最优的超平面来分割样本空间,使得不同类别的样本尽可能远离超平面。实际上,SVM通过最大化支持向量与超平面的距离,来确保分类的准确性和泛化能力。 在书籍中,作者通过经典的例子和详细的代码示例,展示了如何应用Python编程语言和scikit-learn库来构建和训练SVM模型。读者将学会如何准备数据集,进行特征选择和数据预处理,选择合适的SVM参数以及评估模型的性能。 此外,书中还强调了交叉验证、网格搜索和模型调优等重要概念。这些概念是整个机器学习过程中不可或缺的一部分,能够帮助我们提高模型的准确性和可靠性。 机器学习实战还提供了丰富的示例和应用,涵盖了多个领域,如文本分类、手写数字识别和人脸识别等。通过这些实例,读者可以深入理解SVM在实际问题中的应用。 总而言之,机器学习实战是一本非常实用的书籍,提供了丰富的例子和代码,使读者能够快速上手并应用SVM算法解决实际问题。无论是对于初学者还是有一定机器学习经验的人来说,这本书都是一本值得推荐的学习资料。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值