自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (2)
  • 收藏
  • 关注

原创 11-18 《演员请就位》弹幕数据分析

数据分析步骤 1.原始数据 ---数据量大 2.数据清洗--- 爬取的数据格式不一致,异常值,缺失值 3.分析数据--可视化 4.得出结论 内容: 1、导入模块/库 import os import numpy as np import pandas as pd from pyecharts.charts import Bar,Pie,Line # Bar 柱形图 Pie 饼图 line 折线图 # pyecharts 库作图 会生成html文件,图有交互效果 2、原始数据的获取 dat

2020-11-18 02:11:21 145

原创 11-17 小练习

备注: 1. 第一个 'hello' 是string,可以直接输出 2. hello是一个变量名,之前未定义,所以不能输出 3. 不同数据类型数据可以 ' ,' 连接,但是不能 ‘+’ 拼接

2020-11-18 01:44:05 59

原创 11 - 15 绝地求生值数分

1、基本步骤 #1. 导入库 pyhdfs/pandas #2.把处理好的数据读取进来 #3.导入可视化库 matplotlib /seaborn #4.作图 #seaborn什么库? Seaborn是一个使用Python制作统计图形的库, 基于matplotlib之上的封装,更加绘图命令更简洁, #通常会配合pandas读写数据和matplotlib扩展绘图一起使用。 # HdfsClient 是用来连接hadoop集群,从而获取数据 #pyhdfs 什么库? hadoop 集群连接库 from p

2020-11-16 01:43:53 77

原创 11-13 猫眼电影多线程爬取

问题: pycharm打开项目运行时,运行按钮显灰色,为什么? 其他项目的 .idea 文件影响导致,关闭项目删除改文件后重启项目就ok 项目练习: 多线程猫眼电影爬取 #多线程猫眼电影爬取 import parsel import requests import re url='https://maoyan.com/board/4?offfset=0' resp=requests.get(url) print(resp.text) sel=parsel.Selector(resp.text) #

2020-11-14 05:02:52 241

2021-05-27function.py

匹配文件的配置文件

2021-05-27

2021-05-27 查询客户邮箱.py

python链接数据库,抓取数据及处理后存入excel或MySQL的脚本(20)

2021-05-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除