- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 11-18 《演员请就位》弹幕数据分析
数据分析步骤 1.原始数据 ---数据量大 2.数据清洗--- 爬取的数据格式不一致,异常值,缺失值 3.分析数据--可视化 4.得出结论 内容: 1、导入模块/库 import os import numpy as np import pandas as pd from pyecharts.charts import Bar,Pie,Line # Bar 柱形图 Pie 饼图 line 折线图 # pyecharts 库作图 会生成html文件,图有交互效果 2、原始数据的获取 dat
2020-11-18 02:11:21 145
原创 11-17 小练习
备注: 1. 第一个 'hello' 是string,可以直接输出 2. hello是一个变量名,之前未定义,所以不能输出 3. 不同数据类型数据可以 ' ,' 连接,但是不能 ‘+’ 拼接
2020-11-18 01:44:05 59
原创 11 - 15 绝地求生值数分
1、基本步骤 #1. 导入库 pyhdfs/pandas #2.把处理好的数据读取进来 #3.导入可视化库 matplotlib /seaborn #4.作图 #seaborn什么库? Seaborn是一个使用Python制作统计图形的库, 基于matplotlib之上的封装,更加绘图命令更简洁, #通常会配合pandas读写数据和matplotlib扩展绘图一起使用。 # HdfsClient 是用来连接hadoop集群,从而获取数据 #pyhdfs 什么库? hadoop 集群连接库 from p
2020-11-16 01:43:53 77
原创 11-13 猫眼电影多线程爬取
问题: pycharm打开项目运行时,运行按钮显灰色,为什么? 其他项目的 .idea 文件影响导致,关闭项目删除改文件后重启项目就ok 项目练习: 多线程猫眼电影爬取 #多线程猫眼电影爬取 import parsel import requests import re url='https://maoyan.com/board/4?offfset=0' resp=requests.get(url) print(resp.text) sel=parsel.Selector(resp.text) #
2020-11-14 05:02:52 241
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人