![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 85
风清俊
山岗不惧清风拂,大海不忧江河截
展开
-
Python文本处理—jieba & wordcloud
原文链接:风一带你一起使用Python的文本库制作词云图碎碎念念: 大家好!我是风一;数据分析师在日常工作中有时需要和文本打交道,最常见的就是从评价或评论中提取一些关键字,比如电商的商品评价,短视频的用户评论等,以便对用户的态度能够有所掌握,协助业务方找到问题所在。Python 提供了非常强大的包来解决此类问题,其中最重要的两个包是 jieba 和 wordcloud。这两个包分别用于分词和绘制词云图,这也是在数据分析中文本处理的两个步骤。分词,顾名思义,就是将一句话切分成不同的词。这类涉及分词的三种原创 2021-09-23 08:41:28 · 580 阅读 · 0 评论 -
数据清洗_缺失值处理
原文链接:风一带你一起学习数据清洗_缺失值处理碎碎念念:大家好!我是风一、有人调侃做数据的、80%的时间都是花在数据清洗上、虽然有时很想反驳一下、但现实确实经常是如此,那么何为数据清洗?需要处理的数据主要又有哪些?那么就让我们开始吧!所谓的清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的;在数据清洗的过程中、主要需要处理的有缺失值、异常值和重复值,以下篇幅为数据缺失值处理。一、数据缺失的两种情况:一种是行记录的缺失,这种情况又称为数据记录的丢失;另一种是数据列原创 2021-09-08 17:34:59 · 3337 阅读 · 0 评论 -
Python数据分析
转载 Python数据分析之思维导图汇总转载 2020-03-22 19:41:45 · 95 阅读 · 0 评论 -
MongoDB基础学习笔记
'''https://www.runoob.com/python3/python-mongodb.html Python MongoDB 菜鸟教程MongoDB适合存储一些关系简单、数据量又很大的数据,比如我们的平台上虚拟机的监控信息,包括内存、IO、CPU、网络等数据,每隔几秒就采集一次数据,每周、每月,量很大,而且旧的监控数据也不会保留太长时间,就使用的mongodb来存储这些数据1.Mongodb/Mysql数据库模型: 非关系型/关系型;存储方式: 虚拟内存+持久化/不同的引擎有原创 2020-09-02 06:56:00 · 149 阅读 · 0 评论 -
python 使用 with open() as 读写文件
python 使用 with open() as 读写文件转载 2020-03-23 20:32:32 · 356 阅读 · 0 评论 -
excel的合并merge
# -*-coding:utf-8 -*-# xlrd openpyxl'''excel导入数据库(多个基本相同列头的excel进行合并) 参考: https://www.jianshu.com/p/d1eed925509b Pandas库read_excel()参数详解 https://www.pypandas.cn/ pandas中文尽可能...原创 2020-03-10 23:04:15 · 2653 阅读 · 0 评论 -
Python连接SQLServer数据库
'''1. 本文主要是Python操作SQLServer示例,包括执行查询及更新操作(写入中文)。2. 需要注意的是:读取数据的时候需要decode('utf-8'),写数据的时候需要encode('utf-8'),这样就可以避免烦人的中文乱码或报错问题。3. Python操作SQLServer需要使用pymssql模块,使用pip install pymssql安装即可。此外代码中使用...转载 2020-03-10 22:49:46 · 611 阅读 · 0 评论 -
matplotlib基础学习笔记
matplotlib是基于Python语言的开源项目,旨在为Python提供一个数据绘图包,实现专业的绘图功能,数据可视化。在这里插入代码片原创 2020-02-28 22:28:01 · 120 阅读 · 0 评论 -
Pandas基础学习笔记
Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法import pandas as pdimport numpy as npdf = pd.DataFra...原创 2020-02-24 23:36:47 · 124 阅读 · 0 评论 -
Numpy基础学习笔记
什么是Numpy?Numpy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种例程,包括数学,逻辑,形状操作,排序,选择,I / O离散傅立叶变换,基本线性代数,基本统计运算,随机模拟等等。import numpy as np# 操作数据s = np.array([1, 2, 3]) # 创建序列...原创 2020-02-24 20:10:05 · 139 阅读 · 0 评论