python的爬虫是什么意思_python爬虫需要什么意思

在使用内置模块的时候需要导入,例如import abc,则导入abc模块,当然模块也可以自己写,相当于一个类,后面放到类里说,这个因为环境闲置,有些无法执行,只能理解了

os系统操作

import os

os.system('ls') #调用系统命令,并返回执行结果,os.system('dir')....

os.popen('ls') #和system相似,system会直接把结果打印到屏幕上,popen可以把结果返回给一个变量,然后可以用read()或for循环来遍历

os.chdir('/home/myuser/py') #windows可以直接把路径打成'c:mypy'这种,os可以将路径改成通用路径

dir_path = os.getcwd() #获取到当前目录,结果是当前目录路径'/home/myuser/py'

os.listdir(dir_path) #获取指定目录下的所有文件和文件夹,结果是一个list

os.path.isdir(dir_name) #判断指定名称是否是文件夹,假如dir_name是个文件夹,则返回True,否则False

os.path.join(dir1,dir2,file1) #合并多个路径,可以是dir1,dir2...,file1

os.mkdir('py') #创建目录,和linux一样,没什么可说的

os.rmdir('py') #删除目录,必须是个空目录,和linux一样

os.environ.get(env) #获取环境变量,例os.environ.get('oracle_home')

re正则操作

import re

a = "my py it's fucking greate!"

几个常用的正则内容,|或,.通配符(同excel的),?匹配0个或1个,匹配0个或多个,+匹配1个或多个,\符号,*比如要匹配需要用转义就是只是个而不是0个或多个,^匹配行开始,$匹配行结尾

(?<=XXX)前视,(?=XXX)后视,这个可以百度,我说不清,一般不会用,爬虫时候用的多

[A-Z]大写的全部字母,[a-z]小写的全部字母,[0-9]全部数字

正则默认是贪婪模式, .*?这样写是非贪婪模式,(XXX)匹配一个字符串

re_value = re.compile('^.*? ') #编译正则表达式,这段正则的意思是匹配从开始到第一个空格的内容,正则最好先编译下再用

re_search = re.search(re_value,a) #在字符串里找正则匹配的,这个不能直接显示需要group

print re_search.group() #结果是my

re_find = re.findall(re_value,a) #在字符串里找全部可以匹配的结果,返回一个迭代

for i in re_find: print i #因为只有一行,因此只找到一个,结果是my,可以自己搞多行试试

re.sub(re_value,'',a) #用''替换re_value,就是把正则匹配的结果替换成空,当然也可以替换成别的,结果是"py it's fucking greate!"

sys,这个功能很乱,我也不知道应该怎么归类

import sys

sys.argv #取得外部传入参数,返回一个list,平常执行命令python a.py,参数在后面输入,例

a.py

a = sys.argv #执行命令python a.py 111 222,执行后a变量的结果是[a.py,111,222]

各种随机生成

import random

random.randint(1,10) #随机生成一个1到10的随机数,结果可能是1/2/3/4/5/6/7/8/9/10其中任意一个

a = ['a','b','c'] #搞个a存个list

random.choice(a) #从a里面随机抽个元素出来,结果可能是'a'/'b'/'c'

random.uniform(1,10) #随机生成一个1到10的随机小数,结果可能是。。。。。这个我就不写了,你懂的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值