Python语言程序设计笔记9(北理工mooc)
Python计算生态概览
从数据处理到人工智能
- 数据表示:采用合适方式表示数据。Numpy、Pandas、SciPy
- 数据清洗:数据归一化、数据转换、异常值处理。
- 数据统计:数据的概要理解,数量、分布、中位数等。
- 数据可视化:直观展示数据内涵的方式。Matplotlib(主要是Matplotlib.pyplot这个子库)、Seaborn、Mayavi(三维可视化)
- 数据挖掘:从数据分析获得知识,产生数据外的价值。
- 人工智能:数据/语言/图像/视觉等方面的深度分析和决策
Python文件处理库
PyPDF2:用来处理PDF文件的工具集
NLTK:自然语言文本处理第三方库
Python-docx:创建或更新Microsoft Word文件的第三方库
Python机器学习
Scikit-learn:机器学习方法工具集
TensorFlow:AlphaGo背后的机器学习计算框架
MXNet:基于神经网络的深度学习计算框架
从Web解析到网络空间
网络爬虫:Requests(最友好)、Scrapy(框架)、pyspider(Web页面爬取系统)
Web信息提取:Beautiful Soup(HTML、XML解析库)、Re(正则表达式解析和处理)、Python-Goose(提取文章类型页面)
Web网站开发:Django(最流行的Web应用框架)、Pyramid(中等规模的Web应用框架)、Flask(Web应用开发微框架)
网络应用开发:WeRoBot(微信公众号开发框架)、aip(百度AI开放平台接口)、MyQR(二维码生成)
Python人机交互和艺术设计
图像用户界面(GUI):PyQt5(Qt框架的Python接口,跨平台,成熟完备,推荐)、wxPython(跨平台开发框架)、PyGObject(使用GTK+开发)
游戏开发:PyGame(最简单)、Panda3D(开源跨平台3D游戏开发库)cocos2d(构建2D游戏和图形界面交互应用)
虚拟现实:VR Zero(在树莓派上开发VR应用)、pyovr(针对Oculus Rift)、Vizard(通用)
图形艺术:Quads(迭代艺术,像素风的转化)、ascii_art(ascii艺术风格)、turtle(Random Art)