自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 Python绘制词云图

1.用到的一些包,如下import jiebaimport collectionsimport refrom pyecharts.charts import WordCloudfrom pyecharts.globals import SymbolTypefrom pyecharts import options as optsfrom pyecharts.globals import ThemeType如果在运行中提示你没有的包,可以使用下面的镜像链接在cmd窗口下安装:pip

2022-03-05 17:17:51 2910

原创 Python中多个列表中元素之间的排列组合--小技巧1

1.代码#!/usr/bin/env python# -*- coding: utf-8 -*-################################################# Author: Echo997# Created Time: 2022-1-9 21:19:06# What does it do:将多个列表中的元素进行排列组合################################################# 示例:排列组合合并3个list的元

2022-01-09 21:33:28 2272 1

原创 Python中反斜杠u类型(\uXXXX)字符串转换为Unicode字符串

1.问题遇到类似于str = "\\u65b0\\u589e\\u4f1a\\u5458" 类型的字符串,想将这种字符串转换成Unicode类型的字符串,即中文字符串,该怎么做?2.解决方法通过Python中的encode函数先将上述字符串str编码成utf-8类型的字符串,再用decode函数将字符串解码就行了,具体操作代码如下:#!/usr/bin/env python 3# -*- coding: utf-8 -*-# author:Echo# time:2022-01-05-

2022-01-05 21:16:51 5105 2

原创 Chromedriver安装教程(简洁版)

1.下载对应的Chromedriver版本首先,打开的谷歌浏览器,找到目前你谷歌浏览器的版本。(打开设置,点击关于谷歌就能看到,如下图)然后chromedriver的版本一定要与Chrome的版本一致,不然下载不对应的版本,没作用。下面有两个下载地址:1.https://npm.taobao.org/mirrors/chromedriver/2.http://chromedriver.storage.googleapis.com/index.html我个人比较喜欢第一个链接下载,

2021-06-07 10:27:05 74355 14

原创 爬取偶像/私房小姐姐图片--爬虫基础篇

1.废话不多说,直接上源码,有注释,相信你们能看到"""objective:爬取任意偶像/单词的百度图片(eg:佟丽娅、清纯小姐姐、蔡徐坤)coding: UTF-8time:2021/5/5author:始终是个小白"""# 导入相关库import reimport requestsimport osdef dowmload(html, search_word, j): pic_url = re.findall('"objURL":"(.*?)",.*?"fromU

2021-05-05 18:22:04 501

原创 excel文件按分组输出文件--python

1.原始excel数据如下图数据如上图,由于数据量过大,且人名较多,单纯的实用excel筛选功能在复制粘贴也能完成,但是比较麻烦可能还很麻烦很慢,所以可以利用python中的pandas包解决此类问题,且只需要7行代码就能解决。2.直接上代码,代码中有注释import pandas as pd # 导入相关库df = pd.read_excel('D:\\Desktop\\门店收入.xlsx') # 读取原始文件groups = df.groupby('主办会计') # 将不

2021-05-04 13:33:59 1221 2

原创 比python更精简的语言,两行代码抓取淘宝/京东平台的商品数据--Uibot

目录1. Uibot简介2.下载安装Uibot3.启动Uibot,两行代码获取淘宝网商品数据4.写在最后1. Uibot简介UiBot是一种RPA平台,RPA的全称是Robotic Process Automation,中文翻译为机器人流程自动化。如果你不了解RPA,那么“按键精灵“你总该知道了吧,没错,UiBot和按键精灵本质上都是RPA工具,但是它们的基本理念上有很多不同点,技术上的差异更是天翻地覆。主要有以下四点:按键精灵针对个人用户的需求做了很多优化,能制作用户界面,能设

2021-03-20 12:05:14 2365 6

原创 合并多个excel文件并按某一或两个特定的列顺序输出

今天要写的就是工作中遇到的,就是个小麻烦而已,很容易解决的,希望能帮到你们。01 确定你要输出的excel文件的初始顺序比如我这次的案例,图中红色箭头标记的两列为初始序列,其他excel数据合并时都会按照这个输出。其他excel部分数据展示可以看到数据结构和源文件的数据结构一直,就是顺序不一致,且不在一个文件中,我们要做的就是将多个这样的excel文件合并成一个。02 不废话,上才艺```pythonimport osimport pandas as pd# 将多个excel文件放

2020-12-16 10:43:59 898

原创 Python绘制函数图像

目录导入相关包一元一次函数一元二次函数指数函数正余弦函数二元一次函数二元二次函数导入相关包from mpl_toolkits.mplot3d import Axes3Dimport numpy as npfrom matplotlib import pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus'...

2020-06-03 21:44:09 49799

原创 Python中turtle画n层m个不同方向的圆,送你一朵小黄花

没啥可说的,直接上代码import turtle # 绘图库def describing_circle(r, n, m): # 页面的大小 turtle.setup(width=1000, height=700) # 颜色 turtle.color('blue', 'orange') # 同时给笔和内部区域设置颜色 # 笔粗细 turtle.pensize(2) # 设置速度并且取消延迟 turtle.Turtle().screen.

2020-05-21 14:55:46 563

原创 利用Python从数据分析的角度告诉你NBA2018-2019常规赛季为什么字母哥比哈登强?

题目:基于NBA2018-2019赛季常规赛球员数据进行数据挖掘1. 挖掘背景与目标1.1 挖掘背景 美国职业篮球联赛(National Basketball Association),简称NBA,于1946年6月6日在纽约成立,是由北美三十支队伍组成的男子职业篮球联盟,汇集了世界上最顶级的球员,是美国四大职业体育联盟之一。诞生了:迈克尔·乔丹,比尔·拉塞尔,卡里姆·...

2020-04-27 14:41:22 3331 7

原创 Python中内置open()函数打开文件的12种访问模式

在python中,使用open方法打开文件,语法如下:open(文件名,访问模式)函数打开文件的各种访问模式如下:

2020-04-22 19:02:53 4772

原创 Python获取股票数据及其可视化--基于tushare库

01 Tushare简介Tushare是一个金融大数据开放社区,它免费提供各类金融数据和区块链数据 , 助力智能投资与创新型投资。在Tushare 旧版 运行了3年后,Tushare Pro终于要跟大家见面了。Pro版数据更稳定质量更好了,但Pro依然是个开放的,免费的平台,不带任何商业性质和目的。Tushare运行三年多以来,数据从广度和深度都得到了提升,Pro版正是在此基础上做了更大的改进。...

2020-04-16 18:04:42 6849 1

原创 SQL学习之经典50题--详细的求解答案过程和结果输出

基础知识学习基础知识学习网站:w3school经典SQL习题50道一些SQL语句常识1.一定要记住,SQL 对大小写不敏感!2.分号是在数据库系统中分隔每条 SQL 语句的标准方法,这样就可以在对服务器的相同请求中执行一条以上的语句。如果您使用的是 MS Access 和 SQL Server 2000,则不必在每条 SQL 语句之后使用分号。3.可以把 SQL 分为两个部分:数据操作...

2020-04-06 10:50:10 5776

原创 mysql中在查询结果列表中添加一列递增的序号列

建立一个表为例子SId 学生编号, Sname 学生姓名, Sage 出生年月, Ssex 学生性别create table Student (SId varchar(10), Sname varchar(10), Sage datetime, Ssex varchar(10));insert into Student values('01' , '赵雷' , '1990-01-01' , ...

2020-04-04 10:48:22 3216 2

原创 win10安装MySQL8.0.18教程

下载Mysql首先下载安装包: https://www.mysql.com/cn/downloads/拉到最下面,找到MySQL Community Edition (GPL)(注:GPL版本为开源,非商用;commercial为商用版)点击链接进入后, 会有一大堆可下载的选项对应不同的安装方式。windows安装选择 https://dev.mysql.com/download...

2020-03-08 22:20:48 779

原创 Seaborn之简单绘图--散点图

1.绘图函数seaborn.scatterplot(x=None, y=None, hue=None, style=None, size=None, data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=True, style_ord...

2020-03-06 17:59:04 3681 2

原创 Matplotlib官方文档链接

https://matplotlib.org/tutorials/index.html

2020-03-06 15:32:51 250

原创 异常值检测的常用方法简述

目录异常值定义为什么进行异常值分析?常用的异常值检测方法如下1. 简单的描述性统计分析方法2. 3原则方法3. 箱型图分析方法4.Z-score方法5.DBSCAN方法6.孤立森林(Isolation Forest)方法异常值定义异常值是指样本中的个别值,其数值明显偏离它(或他们)所属样本的其余观测值。为什么进行异常值分析?异常值分析是检验...

2019-06-17 23:12:02 33817

原创 数据库之事务处理

什么是事务处理?事务处理是一种机制,用来管理必须成批执行的SQL操作,保证数据库不包含不完成的操作结果。利用事务处理,可以保证一组操作不会中途停止,他们要么完全执行,要么完全不执行。如果没有错误发生,整组语句提交给数据库表;如果发生错误,则进行退回,将数据库恢复到某个已知且安全的状态。为什么使用事务处理?使用事务处理,是为了确保成批的SQL操作要么完全执行,要么完全不执行,来维护数据库...

2019-06-09 20:27:25 1111

原创 数据库的存储过程

什么是存储过程?简单地说,存储过程就是为以后使用而保存的一条或多条SQL语句。可以将器视为文件,虽然他们的作用不仅仅限于批处理。为什么使用存储过程?通过不处理封装在一个易用的单元里,可以简化复杂的操作。由于不要求反复建立一系列处理操作,因而保证了数据的一致性。如果所有的开发人员和应用程序都是用同一存储过程,则所有的代码都是一样的。这一点的延伸就是防止错误。简化对变动的管理。如表名、列名...

2019-06-09 19:04:40 107

原创 算法简介之Logistic回归

Logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,虽然名字中有“回归”二字,但实际却是一种分类学习方法。对于回归这个概念,简单的说,回归就是用一条线对N个数据点进行一个拟合,这个拟合的过程就叫做回归。Logistic回归分类算法就是对数据集建立回归公式,以此进行分类。而至于如何寻找最佳回归系数,或者说是分类器的训练,就需要使用到最优化算法了。Logistic回归函...

2019-06-09 18:08:12 1218

转载 算法简介之决策树

决策树是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。决策树中很重要的一点就是选择一个属性进行分枝,因此要介绍一下信息增益的计算公式,并深入理解它。信息熵的计算公式如下:  其中的n代表有n个分类类别(比如假设是2类问题,那么n=2)。分别计算这2类样本...

2019-06-09 12:50:21 175

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除