python安装包basemap-1.2.1-cp37-cp37m-win_amd64.whl
python安装包,basemap-1.2.1-cp37-cp37m-win_amd64.whl和pyproj-2.6.1.post1-cp37-cp37m-win_amd64.whl安装包,亲测有效
talkingdata-mobile-user-demographics.zip
基于用户app的下载和使用情况预测用户的人口属性(性别和年龄)
gender_age:训练和测试集
events, app_events: 当用户使用TakingData SDK时,系统记录的日志。包括经纬度和对应app情况。
phone_brand_device_mode:用户的手机属性
数据集介绍:https://www.infoq.cn/article/predict-mobile-users-Kaggle-contest
PoiMap.zip
百度地图,实现GPS轨迹绘制
实现思路:
1.根据经纬度实现车辆轨迹绘制
2.使用百度地图API的两个覆盖物实现,Polyline(折线)绘制轨迹,Marker(图标)绘制小车图标
3.将每两个坐标间连线起来,形成连贯的轨迹线路
4.生成下一个图标后删除上一个绘制的图标,形成小车移动动画感
5.本例使用的是临近的随机坐标点
citydf.xls
全国340个地级以上城市中心经纬度,经纬度基本在区域中心,请酌情考虑使用,文档为EXCEL文档,方便编辑。
TMDB 5000 Movie Dataset
数据集包含:tmdb_5000_movies.csv、tmdb_5000_credits.csv是Kaggle平台上的项目TMDB(The Movie Database),共计4803部电影,主要为美国地区一百年间(1916-2017)的电影作品。
Python分析:https://blog.csdn.net/zhuoyue65/article/details/80285875
人工智能产品经理
随着人工智能热潮的兴起,企业对人工智能领域产品经理的人才需求也开始井喷,人工智能产品经理成为顺应时代潮流的重要人力资源。实际上,人工智能确实给现有的产品和服务带来了全方位的升级,这也给产品经理从业人员提出了更高的要求,是关注人工智能产品的产品经理们面临的一次关键转型考验。
人工智能产品经理的新起点_黄钊
互联网产品经理必读
2017全球人工智能人才白皮书
2017全球人工智能人才白皮书,最新版腾讯研究院自2017年发布8月先后发布《中美两国人工智能产业发展全面解读》和《2017中美人工智能创投现状与趋势研究报告》之后,引起许多读者好评。
有读者来研究院走访,建议研究全球人工智能人才分布的课题,以便让公众更好的把握产业发展现状。
这个建议得到许多朋友的认同,大家认为,在算法算力数据都得到了较好解决的今天,AI产业的发展,更多的依赖科学家和各层面的科研人员。
Python项目开发实战(第2版)带标签
目录 · · · · · ·
第1部分 Python开发入门 1
第1章 Python入门 2
1.1 安装Python 2
1.1.1 安装deb包 3
1.1.2 安装第三方包 4
1.1.3 virtualenv的使用方法 5
1.1.4 多版本Python的使用 7
1.2 安装Mercurial 9
1.2.1 Mercurial概述 10
1.2.2 安装Mercurial 10
1.2.3 创建版本库 11
1.2.4 文件操作 12
1.3 编辑器与辅助开发工具 14
1.3.1 编辑器 14
1.3.2 开发辅助工具 20
1.4 小结 22
第2章 开发Web应用 24
2.1 了解Web应用 24
2.1.1 Web应用是什么 24
2.1.2 Web应用与桌面应用的区别 25
2.1.3 Web应用的机制 25
2.2 前置准备 28
2.2.1 关于Flask 28
2.2.2 安装Flask 28
2.3 Web应用的开发流程 29
2.4 明确要开发什么应用 30
2.4.1 留言板应用的需求 30
2.4.2 明确必备的功能 30
2.4.3 明确必备的页面 31
2.5 页面设计 31
2.5.1 确定成品页面的形式 31
2.5.2 编写HTML和CSS 32
2.6 实现功能 37
2.6.1 保存留言数据 37
2.6.2 获取已保存的留言列表 38
2.6.3 用模板引擎显示页面 39
2.6.4 准备评论接收方的URL 42
2.6.5 调整模板的输出 43
2.7 查看运行情况 45
2.8 小结 47
第3章 Python项目的结构与包的创建 48
3.1 Python项目 48
3.2 环境与工具 49
3.2.1 用virtualenv搭建独立环境 49
3.2.2 用pip安装程序包 55
3.2.3 小结 62
3.3 文件结构与发布程序包 62
3.3.1 编写setup.py 62
3.3.2 留言板的项目结构 64
3.3.3 setup.py与MANIFEST.in——设置程序包信息与捆绑的文件 65
3.3.4 setup.py——创建执行命令 69
3.3.5 python setup.py sdist——创建源码发布程序包 71
3.3.6 提交至版本库 71
3.3.7 README.rst——开发环境设置流程 73
3.3.8 变更依赖包 75
3.3.9 通过requirements.txt固定开发版本 77
3.3.10 python setup.py bdist_wheel——制作用于wheel发布的程序包 78
3.3.11 上传到PyPI并公开 79
3.3.12 小结 85
3.4 小结 86
第2部分 团队开发的周期 87
第4章 面向团队开发的工具 88
4.1 问题跟踪系统 88
4.1.1 Redmine 88
4.1.2 安装Redmine 89
4.1.3 Redmine的设置 91
4.1.4 插件 93
4.2 版本控制系统 94
4.2.1 Mercurial与Redmine的联动 94
4.2.2 用于生成版本库的插件 95
4.3 聊天系统 97
4.3.1 Slack 97
4.3.2 Slack的特点 98
4.3.3 Slack做不到的事 101
4.3.4 Slack的注册 102
4.4 对团队开发有帮助的工具 102
4.4.1 Dropbox 102
4.4.2 Google Drive 102
4.5 小结 103
第5章 项目管理与审查 104
5.1 项目管理与问题的区分使用 104
5.1.1 项目管理的前置准备工作 104
5.1.2 创建问题 105
5.1.3 整理问题 107
5.1.4 分割问题 107
5.2 问题模板 108
5.2.1 安装插件 108
5.2.2 问题模板的使用方法 109
5.2.3 Global Issue Templates 111
5.2.4 问题模板示例 112
5.3 问题驱动开发 114
5.3.1 别急着敲代码,先建问题 114
5.3.2 创建与问题编号同名的分支 115
5.3.3 让发布与分支相对应 115
5.3.4 分支的合并 116
5.4 审查 117
5.4.1 为什么需要审查 117
5.4.2 审查委托:代码审查篇 118
5.4.3 审查委托:作业审查篇 119
5.4.4 实施审查:代码审查篇 120
5.4.5 实施审查:作业审查篇 123
5.5 小结 123
第6章 用Mercurial管理源码 125
6.1 Mercurial版本库的管理与设置 125
6.1.1 服务器上的Uinx用户群设置 125
6.1.2 创建版本库 126
6.1.3 hgrc的设置 127
6.1.4 使用设置好的版本库 127
6.1.5 使用hgweb建立简易中央版本库 127
6.2 灵活使用“钩子” 128
6.2.1 钩子功能的设置方法 129
6.2.2 尝试钩子脚本 129
6.2.3 钩子事件 130
6.2.4 钩子功能的执行时机 131
6.2.5 编写钩子脚本 134
6.3 分支的操作 136
6.4 关于合并 137
6.4.1 未发生冲突的合并 138
6.4.2 合并时发生冲突以及用文本编辑器解决冲突的方法 140
6.4.3 合并的类型与冲突 143
6.4.4 用GUI的合并工具进行合并 144
6.5 GUI客户端 147
6.5.1 GUI客户端的介绍 147
6.5.2 GUI客户端的优点 149
6.5.3 GUI客户端的缺点 151
6.6 考虑实际运用的BePROUD Mercurial Workflow 152
6.6.1 概述 152
6.6.2 背景 152
6.6.3 版本库的结构 153
6.6.4 提交源码 154
6.6.5 提交设计 156
6.6.6 分支的合并 157
6.6.7 集成分支 158
6.7 小结 160
第7章 完备文档的基础 162
7.1 要记得给项目写文档 162
7.1.1 写文档时不想做的事 162
7.1.2 什么样的状态让人想写文档 164
7.2 Sphinx的基础与安装 165
7.2.1 Sphinx的安装 166
7.2.2 reStructuredText入门 167
7.2.3 用Sphinx写结构化文档的流程 169
7.2.4 Sphinx扩展 174
7.3 导入Sphinx可解决的问题与新出现的问题 175
7.3.1 由于是纯文本,所以能在平时用的编辑器上写文档 176
7.3.2 信息与视图相分离,所以能集中精神编辑内容,不用顾虑装饰等外观问题 176
7.3.3 可根据一个源码输出PDF等多种格式 179
7.3.4 通过结构化,文档可分成几个文件来写 180
7.3.5 能用Mercurial等轻松实现版本管理 181
7.3.6 API参考手册与程序的管理一体化 182
7.3.7 通过Web浏览器共享 184
7.3.8 导入Sphinx后仍存在的问题 185
7.4 文档集的创建与使用 186
7.4.1 什么是文档集 186
7.4.2 项目所需文档的一览表 187
7.4.3 面向项目组长、经理 187
7.4.4 面向设计者 189
7.4.5 面向开发者 189
7.4.6 面向客户 189
7.5 小结 190
第8章 模块分割设计与单元测试 191
8.1 模块分割设计 191
8.1.1 功能设计 191
8.1.2 构成Web应用的组件 192
8.1.3 组件设计 194
8.1.4 模块与程序包 195
8.2 测试 197
8.2.1 测试的种类 197
8.2.2 编写单元测试 198
8.2.3 从单元测试中剔除环境依赖 209
8.2.4 用WebTest做功能测试 215
8.3 通过测试改良设计 219
8.4 推进测试自动化 221
8.4.1 用tox自动生成执行测试的环境 221
8.4.2 可重复使用的测试环境 223
8.5 小结 223
第9章 Python封装及其运用 224
9.1 使用程序包 224
9.1.1 程序包的版本指定 224
9.1.2 从非PyPI服务器安装程序包 226
9.1.3 程序包的发布格式 228
9.1.4 生成wheelhouse的方法 230
9.1.5 从wheelhouse安装 231
9.2 巧用程序包 232
9.2.1 私密发布 232
9.2.2 巧用requirements.txt 232
9.2.3 requirements.txt层级化 233
9.2.4 为部署和CI+tox准备的requiremests 234
9.2.5 通过requirements.txt指定库的版本 235
9.3 小结 236
第10章 用Jenkins持续集成 237
10.1 什么是持续集成 237
10.1.1 持续集成的简介 237
10.1.2 Jenkins简介 239
10.2 Jenkins的安装 239
10.2.1 安装Jenkins主体程序 239
10.2.2 本章将用到的Jenkins插件 240
10.3 执行测试代码 241
10.3.1 让Jenkins运行简单的测试代码 241
10.3.2 添加Job 242
10.3.3 Job的成功与失败 244
10.4 测试结果输出到报告 246
10.4.1 安装pytest 246
10.4.2 调用pytest命令 246
10.4.3 根据pytest更改Jenkins的设置 246
10.5 显示覆盖率报告 247
10.5.1 安装pytest-cov 248
10.5.2 从pytest获取覆盖率 248
10.5.3 读取覆盖率报告 248
10.6 执行Django的测试 250
10.6.1 安装Python模块 250
10.6.2 Django的调整 251
10.6.3 示例代码 251
10.6.4 Jenkins的调整 255
10.6.5 “构建后操作”选项卡的设置 257
10.7 通过Jenkins构建文档 260
10.7.1 安装Sphinx 261
10.7.2 在Jenkins添加Job 261
10.7.3 Sphinx构建发出警告时令Job失败 261
10.7.4 查看成果 262
10.7.5 通过Task Scanner Plugin管理TODO 263
10.7.6 Task Scanner Plugin的设置示例 264
10.8 Jenkins进阶技巧 265
10.8.1 好用的功能 265
10.8.2 进一步改善 267
10.9 小结 268
第3部分 服务公开 269
第11章 环境搭建与部署的自动化 270
11.1 确定所需环境的内容 270
11.1.1 网络结构 270
11.1.2 服务器搭建内容的结构化 272
11.1.3 用户的设置 273
11.1.4 选定程序包 274
11.1.5 中间件的设置 277
11.1.6 部署 280
11.2 用Ansible实现自动化作业 282
11.2.1 Ansible简介 282
11.2.2 文件结构 287
11.2.3 执行Ansible 288
11.2.4 与最初确定的结构相对应 288
11.2.5 将各步骤Ansible化 289
11.2.6 整理Ansible的执行环境 295
11.3 小结 296
第12章 应用的性能改善 298
12.1 Web应用的性能 298
12.1.1 Web应用面对大量集中请求时会产生哪些问题 298
12.1.2 针对高负荷的对策 299
12.2 评估留言板应用的性能 300
12.2.1 什么是应用的性能 300
12.2.2 安装ApacheBench 300
12.2.3 用ApachBench评估性能 301
12.3 gunicorn简介 303
12.3.1 安装gunicorn 304
12.3.2 在gunicorn上运行应用 304
12.4 nginx简介 306
12.4.1 安装nginx 306
12.4.2 检测nginx的性能 307
12.5 在nginx和gunicorn上运行应用 310
12.5.1 gunicorn的设置 310
12.5.2 nginx的设置 310
12.5.3 评估nginx+gunicorn的性能 311
12.5.4 性能比较 312
12.6 小结 313
第4部分 加速开发的技巧 315
第13章 让测试为我们服务 316
13.1 认识现状:测试的客观环境 316
13.2 将测试导入开发各个阶段 317
13.2.1 文档的测试(审查) 317
13.2.2 测试设计的编写方法(输入与输出) 320
13.2.3 测试的实施与测试阶段的轮换(做什么,做多少) 323
13.3 小结:测试并不可怕 326
第14章 轻松使用Django 327
14.1 Django简介 327
14.1.1 Django的安装 327
14.1.2 Django的架构 327
14.1.3 Django的文档 331
14.2 数据库的迁移 331
14.2.1 什么是数据库的迁移 331
14.2.2 Django的迁移功能 332
14.3 fixture replacement 339
14.3.1 什么是测试配置器 339
14.3.2 几种不便使用默认配置器的情况 342
14.3.3 如何使用factory_boy 343
14.3.4 消除“不便使用默认配置器的情况” 345
14.4 Django Debug Toolbar 346
14.5 小结 353
第15章 方便好用的Python模块 355
15.1 轻松计算日期 355
15.1.1 日期计算的复杂性 355
15.1.2 导入dateutil 357
15.2 简化模型的映射 359
15.2.1 模型映射的必要性 359
15.2.2 映射规则的结构化与重复利用 360
15.2.3 导入bpmappers 363
15.2.4 与Django联动 366
15.2.5 编写JSON API 367
15.3 图像处理 369
15.3.1 安装Pillow 369
15.3.2 图像格式转换 371
15.3.3 改变图像尺寸 372
15.3.4 剪裁图像 374
15.3.5 对图像进行滤镜处理 375
15.4 数据加密 377
15.4.1 安装PyCrypto 377
15.4.2 通用加密系统的加密及解密 377
15.4.3 公钥加密系统(RSA)的加密与解密 378
15.5 使用Twitter的API 382
15.5.1 导入tweepy 382
15.5.2 添加应用与获取用户密钥 382
15.5.3 获取访问令牌 385
15.5.4 调用Twitter API 385
15.5.5 编写用Twitter认证的系统 387
15.6 使用REST API 393
15.6.1 REST简介 394
15.6.2 导入Requests 394
15.6.3 导入测试服务器 394
15.6.4 发送GET请求 396
15.6.5 发送POST请求 397
15.6.6 发送JSON格式的POST请求 398
15.6.7 使用GET/POST之外的HTTP方法 399
15.7 小结 400
附录 401
附录A VirtualBox的设置 402
A.1 安装VirtualBox 402
A.2 新建虚拟机 403
A.3 备份虚拟机 404
附录B OS(Ubuntu)的设置 407
B.1 安装Ubuntu 407
B.2 SSH的设置 417
B.3 中文的设置 419
B.4 添加用户 419
fer2013人脸表情识别数据集
该数据是kaggle2013年一个比赛的数据集,比赛网址为:https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data
数据包含三个文件:fer2013.bib,fer2013.csv,README
剑指offer完整版PDF带目录源码(C++和Java版)
目录 · · · · · ·
第1章 面试的流程 1
1.1 面试官谈面试 1
1.2 面试的3种形式 2
1.2.1 电话面试 2
1.2.2 共享桌面远程面试 3
1.2.3 现场面试 4
1.3 面试的3个环节 5
1.3.1 行为面试环节 5
1.3.2 技术面试环节 10
1.3.3 应聘者提问环节 17
1.4 本章小结 18
第2章 面试需要的基础知识 20
2.1 面试官谈基础知识 20
2.2 编程语言 21
2.2.1 C++ 22
2.2.2 C# 27
2.3 数据结构 36
2.3.1 数组 36
2.3.2 字符串 47
2.3.3 链表 55
2.3.4 树 59
2.3.5 栈和队列 67
2.4 算法和数据操作 71
2.4.1 递归和循环 72
2.4.2 查找和排序 78
2.4.3 回溯法 87
2.4.4 动态规划与贪婪算法 93
2.4.5 位运算 98
2.5 本章小结 103
第3章 高质量的代码 104
3.1 面试官谈代码质量 104
3.2 代码的规范性 105
3.3 代码的完整性 106
3.4 代码的鲁棒性 132
3.5 本章小结 151
第4章 解决面试题的思路 153
4.1 面试官谈面试思路 153
4.2 画图让抽象问题形象化 154
4.3 举例让抽象问题具体化 163
4.4 分解让复杂问题简单化 184
4.5 本章小结 199
第5章 优化时间和空间效率 201
5.1 面试官谈效率 201
5.2 时间效率 202
5.3 时间效率与空间效率的平衡 237
5.4 本章小结 254
第6章 面试中的各项能力 256
6.1 面试官谈能力 256
6.2 沟通能力和学习能力 257
6.3 知识迁移能力 260
6.4 抽象建模能力 293
6.5 发散思维能力 305
6.6 本章小结 313
第7章 两个面试案例 315
7.1 案例一:(面试题67)把字符串转换成整数 316
7.2 案例二:(面试题68)树中两个节点的最低公共祖先 324
Python数据分析与挖掘实战pdf带标签+源代码
目录 · · · · · ·
前言
基础篇
第1章 数据挖掘基础2
1.1 某知名连锁餐饮企业的困惑2
1.2 从餐饮服务到数据挖掘3
1.3 数据挖掘的基本任务4
1.4 数据挖掘建模过程4
1.4.1 定义挖掘目标4
1.4.2 数据取样5
1.4.3 数据探索6
1.4.4 数据预处理7
1.4.5 挖掘建模7
1.4.6 模型评价7
1.5 常用的数据挖掘建模工具7
1.6 小结9
第2章 Python数据分析简介10
2.1 搭建Python开发平台12
2.1.1 所要考虑的问题12
2.1.2 基础平台的搭建12
2.2 Python使用入门13
2.2.1 运行方式14
2.2.2 基本命令15
2.2.3 数据结构17
2.2.4 库的导入与添加20
2.3 Python数据分析工具22
2.3.1 Numpy23
2.3.2 Scipy24
2.3.3 Matplotlib24
2.3.4 Pandas26
2.3.5 StatsModels27
2.3.6 Scikit-Learn28
2.3.7 Keras29
2.3.8 Gensim30
2.4 配套资源使用设置31
2.5 小结32
第3章 数据探索33
3.1 数据质量分析33
3.1.1 缺失值分析34
3.1.2 异常值分析34
3.1.3 一致性分析37
3.2 数据特征分析37
3.2.1 分布分析37
3.2.2 对比分析40
3.2.3 统计量分析41
3.2.4 周期性分析44
3.2.5 贡献度分析45
3.2.6 相关性分析47
3.3 Python主要数据探索函数50
3.3.1 基本统计特征函数50
3.3.2 拓展统计特征函数53
3.3.3 统计作图函数54
3.4 小结59
第4章 数据预处理60
4.1 数据清洗60
4.1.1 缺失值处理60
4.1.2 异常值处理64
4.2 数据集成64
4.2.1 实体识别64
4.2.2 冗余属性识别65
4.3 数据变换65
4.3.1 简单函数变换65
4.3.2 规范化66
4.3.3 连续属性离散化68
4.3.4 属性构造70
4.3.5 小波变换71
4.4 数据规约74
4.4.1 属性规约74
4.4.2 数值规约77
4.5 Python主要数据预处理函数80
4.6 小结81
第5章 挖掘建模83
5.1 分类与预测83
5.1.1 实现过程83
5.1.2 常用的分类与预测算法84
5.1.3 回归分析85
5.1.4 决策树89
5.1.5 人工神经网络95
5.1.6 分类与预测算法评价100
5.1.7 Python分类预测模型特点103
5.2 聚类分析104
5.2.1 常用聚类分析算法104
5.2.2 K-Means聚类算法105
5.2.3 聚类分析算法评价111
5.2.4 Python主要聚类分析算法111
5.3 关联规则113
5.3.1 常用关联规则算法114
5.3.2 Apriori算法114
5.4 时序模式119
5.4.1 时间序列算法120
5.4.2 时间序列的预处理120
5.4.3 平稳时间序列分析122
5.4.4 非平稳时间序列分析124
5.4.5 Python主要时序模式算法132
5.5 离群点检测134
5.5.1 离群点检测方法135
5.5.2 基于模型的离群点检测方法136
5.5.3 基于聚类的离群点检测方法138
5.6 小结141
实战篇
第6章 电力窃漏电用户自动识别144
6.1 背景与挖掘目标144
6.2 分析方法与过程147
6.2.1 数据抽取148
6.2.2 数据探索分析148
6.2.3 数据预处理151
6.2.4 构建专家样本156
6.2.5 模型构建157
6.3 上机实验161
6.4 拓展思考162
6.5 小结163
第7章 航空公司客户价值分析164
7.1 背景与挖掘目标164
7.2 分析方法与过程166
7.2.1 数据抽取168
7.2.2 数据探索分析168
7.2.3 数据预处理169
7.2.4 模型构建173
7.3 上机实验177
7.4 拓展思考178
7.5 小结179
第8章 中医证型关联规则挖掘180
8.1 背景与挖掘目标180
8.2 分析方法与过程181
8.2.1 数据获取183
8.2.2 数据预处理186
8.2.3 模型构建190
8.3 上机实验193
8.4 拓展思考194
8.5 小结194
第9章 基于水色图像的水质评价195
9.1 背景与挖掘目标195
9.2 分析方法与过程195
9.2.1 数据预处理197
9.2.2 模型构建199
9.2.3 水质评价201
9.3 上机实验202
9.4 拓展思考202
9.5 小结203
第10章 家用电器用户行为分析与事件识别204
10.1 背景与挖掘目标204
10.2 分析方法与过程205
10.2.1 数据抽取206
10.2.2 数据探索分析207
10.2.3 数据预处理207
10.2.4 模型构建217
10.2.5 模型检验219
10.3 上机实验220
10.4 拓展思考221
10.5 小结222
第11章 应用系统负载分析与磁盘容量预测223
11.1 背景与挖掘目标223
11.2 分析方法与过程225
11.2.1 数据抽取226
11.2.2 数据探索分析226
11.2.3 数据预处理227
11.2.4 模型构建229
11.3 上机实验235
11.4 拓展思考236
11.5 小结237
第12章 电子商务网站用户行为分析及服务推荐238
12.1 背景与挖掘目标238
12.2 分析方法与过程240
12.2.1 数据抽取242
12.2.2 数据探索分析244
12.2.3 数据预处理251
12.2.4 模型构建256
12.3 上机实验266
12.4 拓展思考267
12.5 小结269
第13章 财政收入影响因素分析及预测模型270
13.1 背景与挖掘目标270
13.2 分析方法与过程272
13.2.1 灰色预测与神经网络的组合模型273
13.2.2 数据探索分析274
13.2.3 模型构建277
13.3 上机实验294
13.4 拓展思考295
13.5 小结296
第14章 基于基站定位数据的商圈分析297
14.1 背景与挖掘目标297
14.2 分析方法与过程299
14.2.1 数据抽取299
14.2.2 数据探索分析299
14.2.3 数据预处理301
14.2.4 模型构建304
14.3 上机实验308
14.4 拓展思考309
14.5 小结309
第15章 电商产品评论数据情感分析310
15.1 背景与挖掘目标310
15.2 分析方法与过程310
15.2.1 评论数据采集311
15.2.2 评论预处理314
15.2.3 文本评论分词320
15.2.4 模型构建320
15.3 上机实验333
15.4 拓展思考334
15.5 小结335
pandas API英文版(20171212版)
pandas: powerful Python data analysis toolkit
Release 0.21.1
Wes McKinney & PyData Development Team
Dec 12, 2017
利用Python进行数据分析pdf中文完整带目录+源代码(py和ipynb)
目录
前言 1
第1章 准备工作 5
本书主要内容 5
为什么要使用Python进行数据分析 6
重要的Python库 7
安装和设置 10
社区和研讨会 16
使用本书 16
致谢 18
第2章 引言 20
来自bit.ly的1.usa.gov数据 21
MovieLens 1M数据集 29
1880—2010年间全美婴儿姓名 35
小结及展望 47
第3章 IPython:一种交互式计算和开发环境 48
IPython基础 49
内省 51
使用命令历史 60
与操作系统交互 63
软件开发工具 66
IPython HTML Notebook 75
利用IPython提高代码开发效率的几点提示 77
高级IPython功能 79
致谢 81
第4章 NumPy基础:数组和矢量计算 82
NumPy的ndarray:一种多维数组对象 83
通用函数:快速的元素级数组函数 98
利用数组进行数据处理 100
用于数组的文件输入输出 107
线性代数 109
随机数生成 111
范例:随机漫步 112
第5章 pandas入门 115
pandas的数据结构介绍 116
基本功能 126
汇总和计算描述统计 142
处理缺失数据 148
层次化索引 153
其他有关pandas的话题 158
第6章 数据加载、存储与文件格式 162
读写文本格式的数据 162
二进制数据格式 179
使用HTML和Web API 181
使用数据库 182
第7章 数据规整化:清理、转换、合并、重塑 186
合并数据集 186
重塑和轴向旋转 200
数据转换 204
字符串操作 217
示例:USDA食品数据库 224
第8章 绘图和可视化 231
matplotlib API入门 231
pandas中的绘图函数 244
绘制地图:图形化显示海地地震危机数据 254
Python图形化工具生态系统 260
第9章 数据聚合与分组运算 263
GroupBy技术 264
数据聚合 271
分组级运算和转换 276
透视表和交叉表 288
示例:2012联邦选举委员会数据库 291
第10章 时间序列 302
日期和时间数据类型及工具 303
时间序列基础 307
日期的范围、频率以及移动 311
时区处理 317
时期及其算术运算 322
重采样及频率转换 327
时间序列绘图 334
移动窗口函数 337
性能和内存使用方面的注意事项 342
第11章 金融和经济数据应用 344
数据规整化方面的话题 344
分组变换和分析 355
更多示例应用 361
第12章 NumPy高级应用 368
ndarray对象的内部机理 368
高级数组操作 370
广播 378
ufunc高级应用 383
结构化和记录式数组 386
更多有关排序的话题 388
NumPy的matrix类 393
高级数组输入输出 395
性能建议 397
附录A Python语言精要 401
titanic_dataset.csv(泰坦尼克数据集)
Abstract
The titanic dataset gives the values of four categorical attributes for each of the 2201 people on board the Titanic when it struck an iceberg and sank. The attributes are social class (first class, second class, third class, crewmember), age (adult or child), sex, and whether or not the person survived.
Data Description
Origin: natural
Usage: assessment
Number of attributes: 4
Number of cases: 2,201
Number of prototasks: 1
Number of methods run on this dataset: 3
Contributed by: Radford Neal
Learning Jupyter 英文高清完整带标签(pdf版和epub版)下载
Learning Jupyter 英文高清完整带标签(pdf版和epub版)下载
pdf版本所有页面使用FoxitReader和PDF-XChangeViewer测试都可以打开
epub版适合kindle爱好者
DS18B20用LCD1602显示Proteus仿真
PIC16F877单片机开发用ds18b20在lcd1602上实现