python数据分析收获与心得体会_Python for Data Analysis 学习心得（一） - numpy介绍

最新推荐文章于 2024-08-10 08:22:05 发布

clairecc ji

最新推荐文章于 2024-08-10 08:22:05 发布

阅读量2.7k

点赞数

文章标签： python数据分析收获与心得体会

本文链接：https://blog.csdn.net/weixin_32287801/article/details/111906981

版权

本文是Python for Data Analysis学习心得的第一部分，主要介绍了numpy在数据分析中的重要性，包括矩阵生成、切片、轴对换、相乘及条件填入等功能，并通过实例展示了numpy如何提高数据处理效率，对比了numpy与for循环的性能差异。

摘要由CSDN通过智能技术生成

一、简介

Python for Data Analysis这本书的特点是将numpy和pandas这两个工具介绍的很详细，这两个工具是使用Python做数据分析非常重要的一环，numpy主要是做矩阵的运算，pandas主要是做数据的预处理，另外本书还教了其他数据分析相关的工具，比如matplotlib用来作图，iPython用来测试、调试代码。本书着重在工具介绍，所以在阅读前最好要对数据分析的理论有一定的了解。

二、Jupyter和Python的介绍

Jupyter是结合代码输入、运行到结果显示为一体的工具，安装后可以直接在浏览器上面使用，非常方便，这边先略过介绍。如果对Python熟悉的话也可以先跳过前面的基础介绍，Python在数据分析方面要对列表(list)和字典(dict)这两个元素的操作非常熟悉，如果还不太熟悉的本书有非常完整的介绍。下面就挑几个重点指令来介绍吧。

1、decode

以前在做NLP爬虫、NLP项目上面在Unicode上面搞了很久，一般网页都会使用unicode来编码，所以用requests抓取下来的通常是编码后的字符，这个时候必须要先去查看网页的编码方式(看是用GBK还是utf-8)，再使用decode+编码方式进行解码。

2、range

自动生成一个数列，range(开始值，结束值，间距)若是只输入一个默认开始值为0，间距为1。range在测试练习的时候很好用，也可以限制循环次数，避免一次跑过多的循环，或是拉数据的时候可以限制显示的数量，挺常用的一个指令。

3、sort、sorted

排序指令，可以将序列由小到大排好，也可以指定排列方式。排序我之

最低0.47元/天解锁文章

clairecc ji

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫