自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 收藏
  • 关注

原创 对比学习,用Excel和Python绘制「子弹图」

大家好,我是云朵君!今天给大家带来一篇比较有意思的可视化图——子弹图详细绘图教程。对比Excel与Pyhton,手把手教你绘制高大上的子弹图。????点击关注|设为星标|干货速递????P...

2021-07-09 11:30:00 471

原创 超5亿中国人的熬夜大赏,快看有你吗?

大家好,我是云朵君!又熬了一个夜,把这篇文章定稿了。原创不易,需要大家点赞在看支持!????点击关注|设为星标|干货速递????累了困了,上床睡觉吧。算了,看会手机再睡。让我来看看今天都发...

2021-07-07 11:30:00 525 2

原创 一个企业级数据挖掘实战项目|教育数据挖掘

导读:大家好,我是云朵君!自从分享了一篇能够写在简历里的企业级数据挖掘实战项目,深受读者朋友们青睐,许多读者私信云朵君,希望多一些类似的数据挖掘实际案例。这就来了。本项目旨在探讨影响学生学...

2021-07-05 11:30:00 660

原创 一道SQL笔试题

????点击关注|选择星标|干货速递????大家好,我是云朵君!一个数据工作者面试数据相关岗位,SQL查询语句是必不可少的笔试环节,今天云朵君给大家带来了某厂一道面试题,附上参考答案,希望...

2021-07-02 11:30:00 457

原创 钱都去哪了?大数据解读年轻人的消费观

精致穷?月光族?花钱大手大脚?真实年轻人的消费观和你想得不一样!大家好,我是云朵君!今年上半年最大的电商购物节618终于在热烈的氛围中落下了帷幕,但这并不是终点,而是我们数据工作者的起点。...

2021-06-30 11:30:00 438

原创 数据挖掘中常用的基本降维思路及方法总结

????点击关注|选择星标|干货速递????01 降维的意义降低无效、错误数据对建模的影响,提高建模的准确性。少量切具有代表性的数据将大幅缩减挖掘所需的时间。降低存储数据的成本。02 需要...

2021-06-28 11:30:00 1483

原创 一文学会设置 Jupyter 主题与目录

????点击关注|选择星标|干货速递????大家好,我是云朵君!前两天因为某些原因,云朵君重装系统了,发现以前的一些设置都没有了,因为一些习惯,还是想恢复下以前的一些设置,如设置Jupyt...

2021-06-25 11:30:00 329

原创 Pandas进阶|数据透视表与逆透视

????点击关注,选择星标,干货速递????数据透视表将每一列数据作为输入,输出将数据不断细分成多个维度累计信息的二维数据表。在实际数据处理过程中,数据透视表使用频率相对较高,今天云朵君就...

2021-06-24 11:30:00 706

原创 一文教你如何全面分析股市数据特征

导读:本文主要从股市数据变量的特征分布及特征重要性两个角度对数据进行分析。通过绘制图表等方法分析特征本身对分布状况或特征间相互关系。通过机器学习模型方法分析出特种重要性排序,选出对结果贡...

2021-06-21 11:30:00 1211

原创 太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

导读:Seaborn就是让困难的东西更加简单。它是针对统计绘图的,一般来说,能满足数据分析90%的绘图需求。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从...

2021-05-08 11:30:00 1282 1

原创 6个步骤搞定金融数据挖掘预处理

导读:预处理是数据挖掘过程和机器学习的重要步骤。它被用来表示 "废料进,废品出"。在机器学习和数据挖掘中,数据采集方法往往控制松散,导致值超出范围、不可能的数据组合、缺失...

2021-05-06 11:30:00 575 1

原创 一文搞懂文件操作与异常模块

大家好!我是云朵君,今天给大家带来一篇Python文件操作与异常处理,这两个部分往往是初学者入门时容易忽略的部分。大家重点的精力都放在如何写出高大上的算法,如何画出酷炫的图形,如何使用机器...

2021-05-04 10:00:00 112 2

原创 入门必备!面向对象编程之Python函数与类

Python支持大多数面向对象编程技术。在Python中所有东西都是对象,包括类、函数、数和模块。它允许多态性,不只是在类层级之内而且通过采用鸭子类型的方式。任何对象可以用于任何类型,只要...

2021-05-02 10:00:00 128

原创 IF-While-For 轻松掌握Python流程控制语句

流程控制语句包括If条件判断语句、While循环语句及For循环语句。If 条件判断If语句允许您检查程序的当前状态,并对该状态作出适当的响应。可以编写一个简单的If语句来检查一个条件,也...

2021-05-01 11:30:00 127

原创 只需七步!零基础入门Python变量与数据类型

Python(英国发音:/ˈpaɪθən/ 美国发音:/ˈpaɪθɑːn/)是一种广泛使用的解释型、高级和通用的编程语言。Python支持多种编程范型,包括函数式、指令式、结构化、面向对象...

2021-04-30 11:30:00 172

原创 超级攻略!Pandas\NumPy\Matrix用于金融数据准备

数据准备是一项必须具备的技术,是一个迭代且灵活的过程,可以用于查找、组合、清理、转换和共享数据集,包括用于分析/商业智能(BI)、数据科学/机器学习(ML)和自主数据集成中。具体来说,数据...

2021-04-28 11:30:00 709 1

原创 进阶法宝!掌握这些 NumPy & Pandas 方法,快速提升数据处理效率

Pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量...

2021-04-26 11:30:00 463 1

原创 Python八种数据导入方法,你掌握了吗?

数据分析过程中,需要对获取到的数据进行分析,往往第一步就是导入数据。导入数据有很多方式,不同的数据文件需要用到不同的导入方式,相同的文件也会有几种不同的导入方式。下面总结几种常用的文件导入...

2021-04-23 11:30:00 2204

原创 如何生成自定义的逆向文件频率(IDF)文本语料库

jieba分词中,关键词提取使用逆向文件频率文本语料库时,除了使用现有的语料库外,还可以自定义生成文本语料库。importjiebaimportjieba.analysetopK...

2021-04-21 11:30:00 1381 4

原创 涨知识!比Open更适合读取文件的Python内置模块

有时我们需要把数据永久存储起来,随时使用随时读取。例如,我们通过程序建立的列表、字典等数据,当程序结束时,需要把这些数据存储到文件中,当程序再次启动时,可以把这些数据读入到程序中,避免这些...

2021-04-19 11:30:00 200

转载 Jieba中文分词 (二) ——词性标注与关键词提取

jieba分词上一篇jieba中文分词(一)分词与自定义字典已介绍了jieba中文分词安装,分词原理,分词方法,自定义字典,添加字典等多种常用分词方法。本篇将继续介绍jieba分词关键词提...

2021-04-16 11:30:00 3399

转载 Jieba中文分词 (一) ——分词与自定义字典

jieba分词特点支持四种分词模式:精确模式试图将句子最精确地切开,适合文本分析;全模式把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式在精确模式的基础...

2021-04-14 11:30:00 10923

原创 VLOOKUP很难理解?或许你就差这一个神器

一说到Excel查找函数,你一定会想到VLOOKUP函数,虽然它是最基础实用的函数,但每次一看就会,一用就忘。接下来给大家分享一个VLOOKUP函数动态图解 ,记得收藏它哦,在每次使用VL...

2021-04-12 11:59:35 697

原创 真棒!彻底解决了一直困扰的编码问题

在批量处理文件(后缀包括 ".csv"、".xlsx"、".xls"的文件)时,可能会出现同一个文件夹内同时存在不同编码的文件;亦或非&#3...

2021-04-08 11:30:00 535

原创 你需要的Excel常用函数都在这里!

Excel常用函数包括逻辑函数、数学函数、文本函数、统计函数、日期函数,熟练并运用好函数,能够让复杂的问题简单化,可以做到批处理,加快处理各种统计、计算类工作。下面就来一起学习吧。建议收藏...

2021-04-06 11:30:00 625

原创 就是这么简单!Pyecharts绘制可视化地图专辑

Pyecharts 是一个用于生成 Echarts 图表的类库。Echarts 是百度开源的一个数据可视化 JS 库。用 Echarts 生成的图可视化效果非常棒,pyecharts 是为...

2021-04-04 11:30:00 2787 2

原创 还对样本不平衡一筹莫展?来看看这个案例吧!

样本不平衡数据集中各个类别的样本数量极不均衡,从数据规模上可分为:大数据分布不均衡。整体数据规模大,小样本类的占比较少,但小样本也覆盖了大部分或全部特征。小数据分布不均衡。整体数据规模小,...

2021-04-02 11:30:00 295

原创 大数据告诉你,你为什么会跳槽?

本文分析数据科学家求职情况数据集,运用常见EDA方法分析每个特征情况及他们与目标变量之间的关系。使用seaborn进行数据可视化辅助分析数据科学家们更换工作都有哪些特征。若你需要了解本数据...

2021-03-31 11:30:00 176

原创 运用Python爬取二手房价格与信息的两种常用方法

最近房地产市场进一步收紧,多地地方政府出台各种收紧政策,以保证房地产健康发展,因此云朵君就想到运用Python网络爬虫,抓取部分房产信息,了解下最近房地产的情况。接下来以房天下二手房信息,以获取某个城市各个区域二手房房产信息急价格,来一起学习下Python网络爬虫的基本方法。备注,本文仅以学习交流,对于爬虫浅尝辄止,以免对服务器增加负担。一、BeautifulSoup解析数据分析网站运用谷歌浏览器开发者工具分析网站# 各区域网站地址如下规律https://cd.esf.fang.com/h

2021-03-30 23:09:46 985

原创 数据科学家们更换工作都有哪些特征(上)?

前面有文章数据分析之探索性数据分析,里面详细阐述了何为EDA,以及一些常用的分析方法,感兴趣的小伙伴们可以参考下。本文分析数据科学家更换工作情况数据集,运用常见EDA方法分析每个特征情况及...

2021-03-29 11:30:00 610

原创 运用Python抓取二手房价格与信息的两种常用方法

最近房地产市场进一步收紧,多地地方政府出台各种收紧政策,以保证房地产健康发展,因此云朵君就想到运用Python网络爬虫,抓取部分房产信息,了解下最近房地产的情况。接下来以房天下二手房信息,...

2021-03-26 11:30:00 282

原创 看完这篇Excel数组简介,你也是Excel高手了!

有这么一种情况,相信有很多小伙伴们都有遇到:需要比较两个工作表或两个工作簿微妙的改动之处,该如何快速且便捷地找出不同之处?以同一个工作簿中到两个工作表为例(比较两个工作簿可以将其复制到同一...

2021-03-24 11:30:00 1862

原创 运用Python爬取并分析全国5w+新楼盘近况

十三届全国人大四次会议5日上午9时在人民大会堂开幕,其中住房政策:“房住不炒”,解决好大城市住房突出问题。本文通过爬取全国各城市在售新房,进行可视化分析。数据获取通过爬取全国城市在售预售新...

2021-03-22 11:30:00 427

原创 再也不用复制粘贴了!自动读取Word文件并写入Excel

python-docx读取Word文件在做数据分析时,虽然操作docx并不是常用操作,但有些时候,数据分析师拿到的文件是docx或doc的Word文件,尤其是对数据具有至关重要的数据字典。...

2021-03-18 11:30:00 1744

原创 快看,教你怎么上班摸鱼!

工作中,当你需要对某个文件夹或多个文件夹内的大量类似文件做相同操作(增删改查)时,你还在拼命加班做一个没有感情的工具人嘛?掌握以下几个操作,瞬间完成任务,然后你就可以摸鱼去了。运用Pyth...

2021-03-15 11:30:00 348

原创 数据可视化 | 手撕 Matplotlib 绘图原理(二)

由于篇幅限制,将文章分为两部分,这是第二部分。点击链接《 Matplotlib 绘图原理(一)》可直达第一部分。线条样式在图上添加文本示例:节假日对美国出生率的影响添加箭头和文字说明误差线...

2021-03-11 11:30:00 216

原创 数据可视化 | 手撕 Matplotlib 绘图原理(一)

本文内容适合入门及复习阅读,绘图所需的基本知识均有涉及,内容较多,由于篇幅限制,故分成两部分。为方面小伙伴们阅读,将本文的目录附在文首。绘图准备导入需要用到的模块中文与负号显示问题解决初步...

2021-03-08 11:30:00 699

原创 MySQL中的通配符与正则表达式

查询"李"姓老师的数量select count(t_id) from te where t_name like '李%';为在搜索子句中使用通配符,必须使...

2021-03-04 11:30:00 296

原创 擅用子查询,让复杂问题简单化

查询"01"课程比"02"课程成绩高的学生信息及课程分数分析第一步:根据需要查询的最终结果确认所需用到的表:"学生信息及课程分数",需要用到...

2021-03-01 11:30:00 95

原创 MySQL高频面试题:一维表转二维表

本文所用的表信息学生表stu字段名数据类型约束条件s_idvarchar(10)primary keys_namevarchar(10)not nulls_birthdates_sexva...

2021-02-25 11:30:00 640

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除