自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 资源 (1)
  • 收藏
  • 关注

原创 base64和图片格式转换

import base64def base64_to_img(base64_str, file_path): """ base64 转 图片格式 :param base64_str: base字符串 :param file_path: 图片文件 :return: """ imgdata = base64.b64decode(base64_str) file = open(file_path, 'wb') file.write(im

2021-10-17 16:18:50 423 1

原创 排列组合与文件查找

import jsonimport pickleimport glob#查找目录中出现单个字符并以.html为后缀的文件print(glob.glob("?.html"))#查找目录中所有以.html为后缀的文件print(glob.glob("*.html"))# 查找目录中出现a.html或b.html的文件print(glob.glob('[a|b].html'))# pickle: 对一个 Python 对象结构的二进制序列化和反序列化。data = "Today i

2021-10-17 15:44:48 133

原创 Python集合

集合创建集合集合的创建和删除集合操作方法(a,b都是集合类型)创建集合使用set构造函数或{}符号来初始化一个集合不要使用空的大括号{ }来创建空的集合; 得到的是一个空的字典使用set构造函数创建空集。集合中只能包含数字、字符串、元组等不可变类型(或者说可散列)的数据,而不能包含列表、字典、集合等可变类型的数据。a = {1,2,3}b = set()c = {i for i in range(10)}print(a,b,c)集合的创建和删除使用del命令删除整个集合po

2021-10-17 15:32:34 189

原创 为markdown目录标题添加序号

前言用markdown做笔记或者写文档时,会涉及到标题的序号。虽然Typora有相关插件,但是导出markdown时,序号不能一起导出。因此需要自动化实现添加标题序号。要求markdown文件中的标题需要是以# 一级标题(最后有空格)的格式暂时没考虑markdown文件中有python的代码注释的情况实现效果思路正则表达式匹配标题行获取标题等级,更新标题列表拼接小于该等级的标题序号重置大于该等级的标题序号Python源码import redef replace_ti

2021-10-17 15:24:34 3544

原创 《深入浅出数据科学》笔记(一)

文章目录如何听起来像数据科学家什么是数据科学数据科学韦恩图数据的类型数据的分类方式结构化数据和非结构化数据定量数据和定性数据案例字段分析内容深入研究数据的4个尺度定类尺度定序尺度定距尺度定比尺度数据科学的5个步骤数据科学和数据分析5个步骤预览提出有意思的问题获取数据探索数据数据建模可视化和结果分享探索数据基本问题定性数据的探索(Python)如何听起来像数据科学家什么是数据科学数据是指有组织和无组织格式聚集在一起的信息有组织数据:指以行列结构分类存储的数据,每一行代表一个观测对象,每一列代表一个观

2021-10-16 23:16:15 1153 1

原创 Typora的CSS设置自动编号

打开Tyopra的主题文件夹编辑文件 base.user.css/** initialize css counter */#write,.sidebar-content,.md-toc-content { counter-reset: h1}#write h1,.outline-h1,.md-toc-item.md-toc-h1 { counter-reset: h2}#write h2,.outline-h2,.md-toc-item.md-toc-h2

2021-09-21 11:19:43 144

原创 B站弹幕的爬取专题系列

yaxis_dataTypeError: add_yaxis() got an unexpected keyword argument ‘yaxis_data’将yaxis_data更改为import pyecharts.options as optsfrom pyecharts.charts import Bar, Line"""Gallery 使用 pyecharts 1.1.0参考地址: https://www.echartsjs.com/examples/editor..

2021-08-29 22:24:26 123

原创 Python音频视频的moviepy使用

安装启动startproject scrapy ESPN

2021-08-25 22:01:17 384

原创 MySQL笔记

MySQL笔记日期时间时间戳转年月日时分秒时间字符串转换日期格式应用统计连续5天登录的用户日期时间时间戳转年月日时分秒select `弹幕时间` as 时间戳 , FROM_UNIXTIME(`弹幕时间`) as 字符串 from jay LIMIT 1,10;时间字符串转换日期格式date(FROM_UNIXTIME(`弹幕时间`,'%Y-%m-%d'))应用统计连续5天登录的用户CREATE table user_login as (SELECT `用户` , date(F

2021-08-21 12:01:54 69

原创 百度一面面经

百度开发测试一面面经自我介绍项目的收获,困难堆栈进程和线程快排的原理数据库模糊查询的关键词三次握手和四次挥手数据库的相关操作有粗细不均匀的两根香,烧完需要1小时,可以一头烧也可以两头烧,请确定15分钟的时刻。...

2021-04-17 15:40:35 64

原创 pandas数据分析和pyecharts可视化周杰伦MV弹幕(多图长文)

import reimport pandas as pdfrom pyecharts import options as optsfrom pyecharts.charts import WordCloudimport jiebafrom pyecharts.globals import SymbolTypefrom pyecharts.charts import Grid, Line, Scatter,Pie,Barimport matplotlibmatplotlib.rcParams

2021-04-14 23:39:15 668 1

原创 数据分析可视化系列(五)弹幕词云图

弹幕词云图使用的词云库核心代码1. 正则表达式2. 标准库多维数组转换为一维数组3. 词云库4. pandas库完整代码使用的词云库jieba中文分词库wordcloud词云库核心代码1. 正则表达式方法函数备注re.compile(pattern)编译re.sub(repl, string)替换repl:编译对象,string:文本2. 标准库多维数组转换为一维数组from itertools import chainlist_2d = [[

2021-01-25 22:22:33 959

原创 数据分析可视化系列(四)B站关键词搜索结果

B站关键词搜索结果寻找数据所在的网址观察数据储存格式json完整代码结果寻找数据所在的网址输入关键词,点击搜索拉到底端点击第三页,从Name中寻找type?context=&page=3&order=&keyword=点击heander,复制request URL中,keyword和page的值是可变的观察数据储存格式json根据自身的需要获取数据完整代码import requestsimport pandas as pdimport jsonim

2021-01-24 16:37:16 930

原创 数据分析可视化系列(三)B站视频弹幕爬虫

B站视频弹幕爬虫相关操作如何寻找oid完整代码文件截图相关操作如何寻找oid按F12,点击展开点击查看历史弹幕,点击日期找到含有oid的url完整代码#!/usr/bin/env python# coding: utf-8import requestsimport pandas as pdimport jsonimport osimport timeimport refrom datetime import datetimeheader = { "Us

2021-01-24 16:09:01 628 1

原创 数据分析可视化系列(二)matplotlib动态显示变化曲线

matplotlib动态显示变化曲线一级目录出现异常完整源码动图显示数据文件一级目录出现异常完整源码# %matplotlib qtimport numpy as npimport matplotlib.pyplot as pltimport matplotlib.animation as animationimport pandas as pdimport randomimport PIL.Image# 字体管理from matplotlib import font_manager

2021-01-24 16:08:16 861

原创 Python常用的知识点

Python知识点1. plt1.1.plt的窗口最大化显示1.2. 设置中文显示和坐标轴负号1.3. plt 往柱状图上添加数据2. 浏览器相关:requests,selenium2.1 伪装浏览器3. 数据结构相关:列表,集合,字典3.1 关键字排序3.2 统计列表中相同元素3.34. 数据分析4.1. pandas4.1.1. 读取csv文件4.2. numpy1. plt1.1.plt的窗口最大化显示plt.get_current_fig_manager().window.state(“zoo

2021-01-19 16:25:54 639

原创 matplotlib绘图

matplotlib绘图例子动态图Vscode中运行jupyter notebook运行动态图Vscode中运行import numpy as npimport matplotlib.pyplot as pltimport matplotlib.animation as animationimport pandas as pd# 字体管理from matplotlib import font_manager# 获取本地的字体my_font = font_manager.FontProp

2021-01-19 11:17:01 131

原创 数据分析可视化系列(一)获取王冰冰B站视频的实时更新数据

获取王冰冰B站视频的实时更新数据前言软件安装和环境网页分析知识点1. 正则表达式2. 第三方库Selenium库的方法和函数2.0 不使用requests库爬虫的原因:2.1 谷歌浏览器的驱动2.2 相关属性和方法3. 文件写入完整代码运行结果前言自从央视记者王冰冰开通B站账号认证后,见识到了恐怖的涨粉模式。本次基于B站网页的实时数据更新,简单监测一下涨粉的速度。后续将推出相应的动态数据可视化。(建议在更新的第一时间内运行此程序,获取的数据更为真实有效准确)软件安装和环境Vscode谷歌浏览

2021-01-17 22:33:33 772

原创 CSS样式表和选择器笔记

CSS样式表笔记1.html标签:标签分类:标签类型转换:写法分类:表格:列表:form表单:form标签属性:2. css样式css样式的写法有三种:设置字体大小和颜色3.选择器:id选择器类选择器标签选择器通用选择器:* 代表所有子集选择器:父级>子集后代选择器:父级 后代伪类选择器:选择器4.盒模型5.字体6.背景7.其他小知识点:1.html标签:标签分类: 块级元素:独占一行,宽高可以设置 div p ul li 行内元素:一行可以放多个,宽高不可以设置,由内容决

2020-10-28 20:37:23 170

原创 常见html元素

常见html元素常见的html元素1.html的作用:定义整个页面"长"成什么样子,相当于网站的骨架。2.html搭骨架的标签:3. 块级元素和行内元素4.标签5.表格table6.表单常见的html元素1.html的作用:定义整个页面"长"成什么样子,相当于网站的骨架。2.html搭骨架的标签:标题标签:h1~h6容器标签:div :定义大的模块段落标签:p :段落行内标签:span :元素内容可以在同一行显示,是个行内元素跳转标签:a :跳转,有个href属性,属性中放网络路径,点击

2020-10-28 20:20:34 266

原创 Fatal error in launcher解决方法

Visual Studio Code出现错误Fatal error in launcherpython终端用pip install出现这个错误Fatal error in launcher终端需要用到pip的东西,都在前面加python -m,比如python -m pip list,python -m pip install pandas等

2020-10-24 14:58:00 4499 2

原创 日期时间,常用数学函数和字符串

数据库的常用操作字符串函数数学函数日期时间时间类型格式字符串函数语法作用备注LOWER(string)转换为小写UPPER(string)转换为大写SUBSTR(string,startposition,length)截取字符串INSERT(str,pos,len,newstr)插入字符串INSTR(string1,string2)子串的位置str_to_date (string[,format])字符串转换为日期格式forma

2020-10-20 19:00:08 323

原创 fractions库的使用

fractions库的使用分数库:fractions参数说明结果分数库:fractions函数或属性功能备注Fraction(value: float, *, _normalize: bool)初始化构造value:浮点型数值, _normalize: True(默认,约分), False(不约分)Fraction(value: str, *, _normalize: bool)初始化构造value:字符串, _normalize: True(默认,约分), Fals

2020-10-19 17:20:52 907

原创 Python定时输出

导入库:schedule参数解释# 参数:# interval: 间隔# job_func: 函数主体(任务)# args: 传入参数# kwargs:传入字典schedule.every(interval=1).seconds.do(job_func,*args, **kwargs)# 秒schedule.every(interval=1).minutes.do(job_func,*args, **kwargs)# 分schedule.every(interval=1).hours.do

2020-10-05 20:28:44 753

原创 利用os搜索本地文件和判断文件类型

Python搜索本地文件知识点:1. walk(path): 返回一个(当前文件夹路径,该目录下文件夹列表,该目录下的文件列表)三元组2. f:工厂模式输出*3. scandir(dir): 扫描dir文件夹下的文件夹样例搜索E盘中存在tomcat的文件或文件夹import ostest_path = "E:\\"for dirpath, dirnames, filenames in os.walk(test_path): if "tomcat" in dirpath and (f

2020-10-05 19:54:00 1232

原创 数据库的表使用(二)

多表使用关键字函数使用计数求和平均最大值最小值四舍五入上下限随机数判断存在排序日期时间模糊查询(开头,结尾,包含)多表查询内连接左外连接右外连接三表查询关键字auto_increment: 自增primary key : 主键not null 非空auto_increment自增primary key主键not null非空unique唯一default默认值comment注释USE barcelona;CREATE T

2020-10-04 16:25:46 151

转载 Python 3 基本的功能使用

字符串函数转自:Python 3 入门,看这篇就够了1.字符串1.1 字符串函数1.2 字符串运算符1.3 格式化符号1.4 格式化辅助指令1.5 转义字符2. 文件操作2.1 读写模式2.2 文件对象方法3. 数学模块(math)3.1 一般方法3.2 三角函数3.3 数学常量4. 命名规范5. 随机数函数(random)6. 运算符优先级7. 身份运算符(is | not is)8. 成员运算符(in | not in)9. 位运算符(& | ^ ~ << >>)10.

2020-10-01 17:36:54 291

原创 数据库的表使用(一)

表的使用前序操作:1. 添加表1.1语法:1.2 创建表2. 删除表3. 修改表修改表名4. 查看表往表中增、删、改、查 数据1. 添加数据2. 删除数据3. 更改数据4. 查询数据查看表内的数据前序操作:创建库打开库1. 添加表1.1语法:create table 表名 (字段名1 数据类型1, 字段名2 数据类型2, ...);1.2 创建表2. 删除表3. 修改表修改表名语法:-- 方法1:rename table 旧表名 to 新表名-- 方法2:alter t

2020-09-30 18:40:27 1206

原创 数据库的库使用

目录1. 显示当前文件夹下的数据库2. 显示当前数据库的所有表3. 查看当前数据库4.打开数据库5. 删除数据库(慎用)1. 显示当前文件夹下的数据库语句:show databases;如果没有在末尾添加分号,需要在新的一行输入\g执行;2. 显示当前数据库的所有表语法:show tables;3. 查看当前数据库语法:select database();如果出现NULL,说明没有选择使用数据库,应该使用 use 数据库名 打开数据库;4.打开数据库语法:use 数据库名

2020-09-30 11:54:42 188

原创 Python过滤器,生成器,映射和装饰器

过滤器,映射和装饰器使用过滤器filter()生成器 generate()映射map()装饰器过滤器filter()语法:filter(function,Iterable)->filter过滤器类似条件语句,对迭代器进行筛选print("过滤器".center(50,'-'))List = [i for i in range(20)] # 列表推导式# 过滤器 lambda 和 位运算print([i for i in filter(lambda x:x&1,List)])

2020-09-28 16:57:17 262

转载 Python内置函数

Python知识点1. Python的68个内置函数(部分)进制转换数学运算字符串str() 将数据转化成字符串format() 与具体数据相关, 用于计算各种小数, 精算等.bytes() 把字符串转化成bytes类型bytearray() 返回一个新字节数组. 这个数字的元素是可变的, 并且每个元素的值得范围是[0,256)repr() 返回一个对象的string形式1. Python的68个内置函数(部分)详细请点击: Python打基础一定要吃透这68个内置函数.进制转换bin

2020-09-28 14:47:48 137

数据分析可视化系列(五)弹幕词云图

数据分析可视化系列(五)弹幕词云图

2021-01-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除