python 学习笔记(3)

模块(包)(部分介绍)

  1. import glob
    1. 用来查找符合特定规则的文件路径:*匹配0个或多个字符,?匹配多个字符
    2. 用法:glob.glob('./data/newsC000013/*.txt')
  2. urllib.request 是用于获取 URL (统一资源定位符)的 Python 模块。它以 urlopen 函数的形式提供了一个非常简单的接口,能用不同的协议获取 URL。
  3. import os.path #主要用于获取文件的属性。
  4. import gzip#gzip模块能够直接压缩和解压缩bytes-like类型的数据,同时也能实现对应格式文件的压缩与解压缩
  5. import pickle#能够实现任意对象与文本之间的相互转化,也可以实现任意对象与二进制之间的相互转化。也就是说,pickle 可以实现 Python 对象的存储及恢复。
  6. import os#os模块提供的就是各种 Python 程序与操作系统进行交互的接口。通过使用os模块,一方面可以方便地与操作系统进行交互,另一方面页可以极大增强代码的可移植性。如果该模块中相关功能出错,会抛出OSError异常或其子类异常。
  7. from sklearn.native_bayes import MultinomialNB
    1. 全称是先验为多项式分布的朴素贝叶斯。假设概率分布是服从一个简单多项式分布。sklearn中的多项式朴素贝叶斯不接受负值的输入。
    2. 多项式朴素贝叶斯的特征矩阵经常是稀疏矩阵(不一定总是稀疏矩阵),并且它经常被用于文本分类。我们可以使用著名的TF-IDF向量技术,也可以使用常见并且简单的单词计数向量手段与贝叶斯配合使用。这两种手段都属于常见的文本特征提取的方法,可以很简单地通过sklearn来实现。
  8. import jieba.posseg as psg#用于词性标注
  9. from jieba import analyse#提取句子级的关键字
  10. os.environ 是一个字典,是环境变量的字典,可以通过 get 方法获取键对应的值(注意 os.environ 的类型并不是 <class ‘dict’>,不是所有字典的函数都能用)
    1. os.environ.get() 是 python 中 os 模块获取环境变量的一个方法,如果有这个键,返回对应的值,如果没有,则返回 none
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值