数据分析
文章平均质量分 66
克莱枫丹36
这个作者很懒,什么都没留下…
展开
-
《深入浅出数据科学》笔记(一)
文章目录如何听起来像数据科学家什么是数据科学数据科学韦恩图数据的类型数据的分类方式结构化数据和非结构化数据定量数据和定性数据案例字段分析内容深入研究数据的4个尺度定类尺度定序尺度定距尺度定比尺度数据科学的5个步骤数据科学和数据分析5个步骤预览提出有意思的问题获取数据探索数据数据建模可视化和结果分享探索数据基本问题定性数据的探索(Python)如何听起来像数据科学家什么是数据科学数据是指有组织和无组织格式聚集在一起的信息有组织数据:指以行列结构分类存储的数据,每一行代表一个观测对象,每一列代表一个观原创 2021-10-16 23:16:15 · 1660 阅读 · 1 评论 -
pandas数据分析和pyecharts可视化周杰伦MV弹幕(多图长文)
import reimport pandas as pdfrom pyecharts import options as optsfrom pyecharts.charts import WordCloudimport jiebafrom pyecharts.globals import SymbolTypefrom pyecharts.charts import Grid, Line, Scatter,Pie,Barimport matplotlibmatplotlib.rcParams原创 2021-04-14 23:39:15 · 1373 阅读 · 1 评论 -
数据分析可视化系列(五)弹幕词云图
弹幕词云图使用的词云库核心代码1. 正则表达式2. 标准库多维数组转换为一维数组3. 词云库4. pandas库完整代码使用的词云库jieba中文分词库wordcloud词云库核心代码1. 正则表达式方法函数备注re.compile(pattern)编译re.sub(repl, string)替换repl:编译对象,string:文本2. 标准库多维数组转换为一维数组from itertools import chainlist_2d = [[原创 2021-01-25 22:22:33 · 1080 阅读 · 0 评论 -
数据分析可视化系列(四)B站关键词搜索结果
B站关键词搜索结果寻找数据所在的网址观察数据储存格式json完整代码结果寻找数据所在的网址输入关键词,点击搜索拉到底端点击第三页,从Name中寻找type?context=&page=3&order=&keyword=点击heander,复制request URL中,keyword和page的值是可变的观察数据储存格式json根据自身的需要获取数据完整代码import requestsimport pandas as pdimport jsonim原创 2021-01-24 16:37:16 · 1054 阅读 · 0 评论 -
数据分析可视化系列(三)B站视频弹幕爬虫
B站视频弹幕爬虫相关操作如何寻找oid完整代码文件截图相关操作如何寻找oid按F12,点击展开点击查看历史弹幕,点击日期找到含有oid的url完整代码#!/usr/bin/env python# coding: utf-8import requestsimport pandas as pdimport jsonimport osimport timeimport refrom datetime import datetimeheader = { "Us原创 2021-01-24 16:09:01 · 744 阅读 · 1 评论 -
数据分析可视化系列(二)matplotlib动态显示变化曲线
matplotlib动态显示变化曲线一级目录出现异常完整源码动图显示数据文件一级目录出现异常完整源码# %matplotlib qtimport numpy as npimport matplotlib.pyplot as pltimport matplotlib.animation as animationimport pandas as pdimport randomimport PIL.Image# 字体管理from matplotlib import font_manager原创 2021-01-24 16:08:16 · 952 阅读 · 0 评论 -
数据分析可视化系列(一)获取王冰冰B站视频的实时更新数据
获取王冰冰B站视频的实时更新数据前言软件安装和环境网页分析知识点1. 正则表达式2. 第三方库Selenium库的方法和函数2.0 不使用requests库爬虫的原因:2.1 谷歌浏览器的驱动2.2 相关属性和方法3. 文件写入完整代码运行结果前言自从央视记者王冰冰开通B站账号认证后,见识到了恐怖的涨粉模式。本次基于B站网页的实时数据更新,简单监测一下涨粉的速度。后续将推出相应的动态数据可视化。(建议在更新的第一时间内运行此程序,获取的数据更为真实有效准确)软件安装和环境Vscode谷歌浏览原创 2021-01-17 22:33:33 · 1028 阅读 · 0 评论