![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 96
张峰π_π
这个作者很懒,什么都没留下…
展开
-
python实现API的调用
python实现API的调用以及数据接口的调用,常用的一些API参考示例。原创 2021-12-11 10:06:33 · 39401 阅读 · 10 评论 -
python实现文本翻译
在很多数据处理的时候,我们可能会面临一个问题-多语言的文本数据,比如我最近做的一个评论数据分析,我们发现这个数据有多种语言形式,这个时候我们需要对它进行统一化,方面后面的进行,不然可能会面临多语言分情况分析(比如做情感分析的时候,语言不同,它所使用的模型也不同),所以这篇博客也是为了那个问题解决所介绍的。下面我主要介绍几种方法:1.translate...原创 2019-11-25 12:02:50 · 11116 阅读 · 3 评论 -
pandas 入门学习
概述pandas作为python的第三方库,它所包含的数据结构和数据处理工具的设计使其在python中进行数据清洗和分析非常快捷,pandas经常是和其他数值计算工具,Numpy和Scipy,以及数据可视化工具比如matplotlib一起使用的。pandas支持大部分Numpy语言风格的数组计算。pandas的 常用的工具数据结构:Series和DataFrame,这两种数据结构为大多数提供了...原创 2019-10-21 17:03:29 · 453 阅读 · 0 评论 -
numpy科学计算入门
为什么要用numpy?NumPy是一个开源的Python科学计算基础库,包含:• 一个强大的N维数组对象 ndarray • 广播功能函数 • 整合C/C++/Fortran代码的工具 • 线性代数、傅里叶变换、随机数生成等功能NumPy是SciPy、Pandas等数据处理或科学计算库的基础在numpy中我们会引入一种数组N维数组对象:ndarray,那么大家肯定在想Python已有列表类...原创 2019-06-02 18:01:34 · 263 阅读 · 0 评论 -
python基于Matplotlib模块的绘图1
Matplotlib模块Matplotlib模块是python中绘图的第三方库,它模仿MATLAB中绘图,既适合交互式地进行制图,也可以作为绘图控件方便地嵌入GUI应用程序中。其中最主要的Matplotlib的pyplot子库提供了和MATLAB类似的绘图API,方便用户快速绘制2D图表,包括直方图、饼图、散点图等.在matplotlib.pyplot中,各种状态在函数调用中保留,以便跟踪当前...原创 2019-09-15 16:22:53 · 495 阅读 · 0 评论 -
python 神奇的第三方库 -Faker
在做数据处理和数据分析的时候,我们总是少不了测试数据,比如你想对设一个合理的数据清洗方案,但有的时候事先能够找一些样例做测试,但大多数的情况是我们自己构建一个测试数据。但对于我这个选择困难症的人,每次想名字或者定一些其他东西都是很纠结,前段时间在一篇微信推文上看到这个库,我觉得对我来说,受益匪浅。Faker这个库简单来说,就是造假,具体怎么造假,我这篇博客会详细的介绍。基本用法安装这个和其...原创 2019-09-21 12:00:18 · 1457 阅读 · 0 评论 -
爬虫系列-正则表达式
我们常常总是说在处理字符串一类数据的时候,总会提到一个正则表达式,但每次别人提到是又爱又恨的感受,它虽然是一个万能的办法,但是它相比其他几个,麻烦很多,一般都不会用它,但它一般都是我们最后的杀手锏,我们在写爬虫的时候也少不它。工具介绍首先提供一个在线测试正则表达式的网站,点开这个链接你就可以进去看,然后最近设计一个匹配的文本,然后就可以得出合理的结果。比如:这个网站对于刚学习的小白是很有用...原创 2019-09-23 16:49:33 · 562 阅读 · 2 评论 -
数据存储
我们对网页进行请求后,然后利用解析器解析出数据,而做数据采集中很重要的一步就是数据存储,如何将爬取的数据保存下来,以及有哪几种途径,我这里大致的介绍一下。我们一般主要有四种,TXT文件,JSON文件,CSV文件以及数据库存储。文章目录TXT文件存储具体实例TXT文件存储将数据保存到TXT文本的操作非常简单,而且TXT文本几乎兼容任何平台,但是这有个缺点,那就是不利于检索。所以如果对检索和数据...原创 2019-10-08 11:11:56 · 205 阅读 · 0 评论