python看不懂代码_爬虫参考,看不懂呀。

[python]代码库def get_label(name):

if name in cats:

return cats[name]

return u'其它'

def get_label_by_crc32(n):

for k in cats:

if binascii.crc32(k)&0xFFFFFFFFL == n:

return k

return u'other'

def get_extension(name):

return os.path.splitext(name)[1]

def get_category(ext):

ext = ext + '.'

cats = {

u'video': '.avi.mp4.rmvb.m2ts.wmv.mkv.flv.qmv.rm.mov.vob.asf.3gp.mpg.mpeg.m4v.f4v.',

u'image': '.jpg.bmp.jpeg.png.gif.tiff.',

u'document': '.pdf.isz.chm.txt.epub.bc!.doc.docx.xlsx.xls.pptx.ppt.',

u'music': '.mp3.wma.ape.wav.dts.mdf.flac.',

u'package': '.zip.rar.7z.tar.gz.iso.dmg.pkg.',

u'software': '.exe.app.msi.apk.',

u'torrent': '.torrent.'

}

for k, v in cats.iteritems():

if ext in v:

return k

return u'other'

def get_detail(y):

if y.get('files'):

y['files'] = [z for z in y['files'] if not z['path'].startswith('_')]

else:

y['files'] = [{'path': y['name'], 'length': y['length']}]

y['files'].sort(key=lambda z:z['length'], reverse=True)

bigfname = y['files'][0]['path']

ext = get_extension(bigfname).lower()

y['category'] = get_category(ext)

y['extension'] = ext

[源代码打包下载]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值