Python____初识+单线程爬虫

本文介绍了Python的基本语法,并通过实例讲解了如何编写单线程爬虫。由于目标网站内容的更新,原文代码可能需要调整正则表达式以适应新的网页结构。建议读者在遇到问题时,自行分析网页结构进行适配。
摘要由CSDN通过智能技术生成

————————————————Python语法初识————————————————



#coding=utf-8
#上面代码含义是改变编码 使Python文件内可以包含中文
__author__ = 'Administrator'
import re

# #是单行注释

# ''' 3引号可以保存内容的换行等格式 本来是用作字符串 如" "  和' '都是用来标注字符串的。 但是''' '''也可以用作多行注释 但本质不是注释 '''

#print 'abc'*20  表示重复输出 !!


#下面是子字符串的用法 可以通过[2]直接选择下表从0开始的第几个字符  也可以选择[3:5]下表从3至5的字符串
c1='abcdefg'
c2=c1[0:3]
c3=c1[0]
print c2+'\n'+c1


#——————————数 字符串 boolean是基本数据类型 数包含int long float  double等——————————


#print 'Python中没有数组概念 但是有["列表","可以修改元素内容","可以读取","括号方式不同"] 和("元组","不可以修改元素内容","只能读取")'
'''  python  元组tuple-->('x','x') 列表list-->[a,b,c] 集合set-->("abjcash") 字典map-->{'key':'value','key2':'value2'}
'''


#集合操作:操作交集 并集 差集 去除重复元素 set是集合
a=set("jksdhzz")
b=set("abcdefghijklmn")
#交集
x=a&b
#并集
y=a|b
#差集
z=b-a
#去除重复  本身输出a也是没有重复的 因为set类型??
new=set(a)
print a


#字典 相当于map
zidian={'name':'yuxi','age':'25','sex':'boy'}
zidian['name']='yuxi2'
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值