- 博客(40)
- 收藏
- 关注
原创 04 数据清洗与准备
目录1. 处理缺失值1.1 过滤缺失值1.2 补全缺失值2. 数据转换2.1 删除重复值2.2使用函数或映射进行数据转换2.3 替代值2.4重命名轴索引2.5离散化和分箱2.6检测和过滤异常值2.7置换和随机抽样2.8计算指标/虚拟变量3 字符串操作3.1字符串对象方法3.2正则表达式3.3pandas中的向量化字符串函数1. 处理缺失值pandas对象的所有描述性统计信息默认情况下是排除缺失值的。对于数值型...
2022-03-27 15:17:09 5195
原创 03 数据载入、存储及文件格式
目录1. 文本格式数据的读写1.1分块读入文本文件1.2将数据写入文本格式1.3使用分隔格式1.4JSON数据1.5XML和HTML:网络抓取1.5.1使用lxml.objectify解析XML2. 二进制格式2.1使用HDF5格式2.2读取Microsoft Excel文件3.与Web API交互4.与数据库交互1. 文本格式数据的读写表格型数据读取为DataFrame对象是pandas的重要特性。read_csv和read_...
2022-03-26 15:49:10 2315
原创 02 pandas入门
目录1. pandas数据结构介绍1.1 Series1.2DataFrame1.3 索引对象2. 基本功能2.1 重建索引2.2轴向上删除条目2.3索引、选择与过滤2.3.1使用loc和iloc选择数据2.4 整数索引2.5 算术和数据对齐2.5.1使用填充值的算术方法2.5.2DataFrame和Series间的操作2.6函数应用和映射2.7 排序和排名2.8含有重复标签的轴索引3.描述性统计的概述与计算3.1相...
2022-03-25 18:51:48 1774
原创 01 NumPy基础
目录1. NumPy ndarray:多维数组对象1.1 生成ndarray1.2 ndarray的数据类型1.3NumPy数组算术1.4基础索引与切片1.4.1 数组的切片索引1.5 布尔索引1.6 神奇索引1.7数组转置和换轴2. 通用函数:快速的逐元素数组函数3. 使用数组进行面向数组编程3.1 将条件逻辑作为数组操作3.2 数学和统计方法3.3 布尔值数组的方法3.4 排序3.5唯一值与其他集合逻辑4. 使用进行文件输入和输...
2022-03-22 20:01:04 1676
原创 08. Python-魔法方法、特性和迭代器
目录1. 构造函数1.1重写普通方法和特殊的构造函数1.2调用未关联的超类构造函数1.3 使用函数super2. 元素访问2.1基本的序列和映射协议2.2 从list、dict和str派生3. 特性3.1 函数property3.2 静态方法和类方法3.3__getattr__ 、__setattr__ 等方法4. 迭代器4.1 迭代器协议4.2 从迭代器创建序列5. 生成器5.1 创建生成器5.2 递归生成器5.3 通...
2022-03-17 18:31:46 477
原创 00. Python基础知识
获取使用指南help()运算符号:+ - * /想丢弃小数部分,即执行整除运算,可使用双斜杠://求余(求模)运算符:% 。eg:x % y 的结果为x 除以y 的余数>>> 10 // 33>>> 10 % 31>>> 9 // 33>>> 9 % 30>>> 2.75 % 0.50.25>>> 10 % 31>>> 10 % -3
2022-03-09 17:37:21 786
原创 Python版本升级与包的维护
1、更新Anacondapip是Python的管理工具,conda是Anaconda的管理工具,在更新Anaconda之前,需要先对conda工具本身进行升级。进入到命令行界 面,输入下述命令更新condaconda update conda然后更新Anacondaconda update anaconda2、查看与更新python版本在命令行中,输入以下指令查看python版本python --version如果要进行python版本更新,也可采用conda工具进行更
2022-01-11 20:00:00 26651 1
原创 jupyter lab无法导入graphviz模块
在graphviz官网下载Graphviz的安装包graphviz下载链接安装时记得勾选添加环境变量。如果没有勾选,找到安装目录,在系统变量中选择Path,新建一个,把D:\Program Files\Graphviz\bin复制粘贴上去现在还不能用,在jupyter lab中导入会报错然后在Anaconda中安装Graphviz库在开始菜单栏中,找到Anaconda prompt并打开,在prompt中输入pip install graphviz,等待...
2021-12-30 20:15:23 1943 2
原创 MySQL for Excel的安装教程
MySQL for Excel的插件链接Excel安装MySQL for Excel时,遇到这个问题这时需要再去微软官网下Visual Studio 2010 Tools for Office Runtime,Visual Studio 2010 Tools for Office Runtime下载链接安装好这个以后,再安装MySQL for Excel就不会有错误了。安装好之后,可以在Excel中的数据选项卡中的最右边看到这个插件。...
2021-12-16 15:07:07 1675 1
原创 谷歌浏览器如何整页截图
1、首先打开我们的网页页面,我们可以看到右边有出现滚动条,说明整个页面内容比较多,需要拉动滚动条才能看到下面的内容。2、我们在页面空白处右键点击。这时会弹出右键菜单。3、弹出的菜单选择【检查】,我们也可以通过快捷方式ctrl+shift+i,也可以。5、我们使用快捷方式ctrl+shift+p,打开一个命令行输入框。然后输入screen,我们选择【Capture full size screenshot】。6、稍等几秒,在浏览器左下方会出现截屏成功的页面图片了。...
2021-11-29 20:10:13 6709
原创 Excel标题如何居中不影响调整列?
Excel中如果标题合并单元格后居中,会影响到列的选择和计算。如果已经合并居中了,点击取消合并居中。然后选中合并后居中的标题行,进入【开始】,然后再选中标题行,单击鼠标右键进入【设置单元格格式】或者点击对齐方式右下角的箭头符号,在设置单元格格式对话框中【对齐】,水平对齐下拉菜单中选择【跨列居中】。...
2021-11-24 17:01:22 1654
原创 使用pip命令提示WARNING: Ignoring invalid distribution
WARNING: Ignoring invalid distribution -ip (c:\python39\lib\site-packages)WARNING: Ignoring invalid distribution - (c:\python39\lib\site-packages)WARNING: Ignoring invalid distribution -ip (c:\python39\lib\site-packages)WARNING: Ignoring invalid distri.
2021-09-07 23:23:48 3830
原创 窗口跑出屏幕外拉不回来
首先按alt+tab键,确保该窗口处于激活位置。然后再按alt+空格键,激活控制菜单。之后按m键,上下左右操作,将窗口移到中央位置。
2021-07-17 16:37:12 674 2
原创 更新包名出错 ERROR: Could not install packages due to an EnvironmentError: [WinError 5] 拒绝访问。
更新包的时候遇到这个错误,那就末尾加上 --userpip install --upgrade 包名 -i https://pypi.douban.com/simple/pip install --upgrade 包名-i https://pypi.douban.com/simple/ --user
2020-12-03 14:05:47 143
原创 如何解决matplotlib中文乱码和坐标轴负号显示
在每次写入代码时,提前键入以下内容:import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号如果想长期解决,不想每次都输入代码,可以用以下方法:在jupyter中输入# 找到matplotlibrc文件,用记事本打开import matplotlib ma..
2020-12-03 11:39:20 850
原创 文件读入数据库,查询时乱码
前段时间遇到一个问题,CSV文件导入数据库后,在数据库中查询,乱码;在Excel中连接数据还是乱码。当时搜了好多种方法,创建的数据库是utf8编码,当时把搜到的方法都试了一遍,修改各种字符集,还是不行。偶然听到一个老师的网课说创建数据库时编码要默认使用utf8mb4,今天试了一下,果然不再乱码了。...
2020-11-27 22:15:10 148
原创 mycli的安装和使用
mycli是MySQL,MariaDB和Percona的命令行界面,具有自动完成和语法高亮功能。1. 安装mycli打开命令行工具(CMD),输入pip install mycli2. 使用mycli使用Mycli连接Mysql数据库的方法和Mysql 命令启动基本相同。在命令行启动数据库:net start mysql然后连接数据库:mycli -u用户名 -p密码效果如下:...
2020-11-14 10:00:00 686
原创 02. 连接数据库&退出数据库&权限管理
1.连接数据库本地连接 语法: mysql -h localhost -u root -p / mysql -uroot -p -h : host(ip地址) localhost = 127.0.0.1 -u : username(用户账户) -p : password(密码) 远程连接 语法: mysql -h 192.168.5.116 -P 3306 -u root -p123456 -P:port(端口号默认3306,可以不写) 第一次使用 ..
2020-11-12 20:06:09 261
原创 怎么查看MySQL数据库的版本
方法一:直接在命令行连接MySQL:可以看到打印出来的日志中包含版本信息【5.7.31】方法二:连接上MySQL后,是输入status也可以查看到版本信息输入\s 也能达到上一步同样的效果方法三:select version();...
2020-11-12 19:42:03 546
原创 06. numpy-数组的索引切片和遍历
和Python里的列表类似,NumPy里的ndarray也支持索引和下标操作数据。索引可以直接使用下标来获取和修改数组里的数据。 na1 = np.array([8, 4, 9, 1, 7])print(na1[0]) # 一维数组可以直接使用下标获取指定位置上的元素print(na1)na1[0] = 10 # 可以通过下标来修改元素print(na1)na2 = np.random.randint(3, 10, size=(3, 5, 2))# 多维数组有两种方式获取指定
2020-11-11 21:53:46 1172
原创 05. numpy-数组的基本运算
基本运算ndarray支持加减乘除算术运算,同时还支持大于小于以及等等与比较运算。import numpy as npx = np.arange(3, 15).reshape((3, 4))y = x > 5print(x)print(y)na1 = np.array([ [1, 2, 3], [2, 5, 7], [3, 8, 6]])na2 = np.array([ [3, 1, 2], [9, 5, 2], [4, 5,
2020-11-03 17:55:13 321
原创 04. numpy-创建ndarray
NumPy提供了很多的函数来快速的生成一个ndarray对象。示例full和full_like:使用指定值来填充数组。na1 = np.full((2,5),10)na2 = np.full_like(np.array([0,1,2,3]),5)zeros和zeros_like:用来创建元素全是0的数组。na1 = np.zeros(shape=(3, 2, 4)) # zeros必须要指定shape,用来生成一个指定形状的数组na2 = np.zeros_like([1,2,3]
2020-11-02 08:41:38 334
原创 03. NumPy数据类型
NumPy数据类型数据类型 说明 bool 布尔类型,1 个字节,值为 True 或 False。 int 整数类型,通常为 int64 或 int32(区分系统) intc 与 C 里的 int 相同,通常为 int32 或 int64。 intp 用于索引,通常为 int32 或 int64。 int8 可以表示 -27到 27-1范围的整数 int16 可以表示 -215到 215-1范围的整数 int32 可以表示 ..
2020-10-31 18:02:00 532
原创 02. NumPy的使用
NumPy的介绍NumPy是科学计算的标准,让Python支持灵活多维的数组,让数学计算快速而简明NumPy是使用Python进行科学计算的基础包 一个强大的N维数组对象 复杂的(广播)功能 用于集成C / C ++和Fortran代码的工具 有用的线性代数,傅里叶变换和随机数功能 除了明显的科学用途外,NumPy还可以用作通用数据的高效多维容器。可以定义任意数据类型。这使NumPy能够无缝快速地与各种数据库集成。import timeimport numpy as np.
2020-10-31 17:59:52 159
原创 01. jupyter的使用
1. 安装和使用jupyter运行pip install jupyter命令即可安装Jupyter. 在命令行中输入jupyter notebook即可启动Jupyter.(在哪个目录下启动jupyter,代码就在哪个目录下) jupyter启动以后,会在电脑上新建一个服务器,并且会自动打开电脑的浏览器访问该服务器。 也可以安装anaconda来使用jupyter2. Jupyter常用快捷键Shift+Enter : 运行本单元,选中下个单元 Ctrl+Enter : 运行本单元 A.
2020-10-31 16:50:21 1144
原创 03. Excel_公式
1. 公式1.1 Excel公式基本使用选择单元格 键入等号“=”。(注意: Excel 中的公式始终以等号开头.) 选择一个单元格,或在所选单元格中键入其地址。 输入运算符。 例如,- 代表相减。 选择下一单元格,或在所选单元格中键入其地址。 按 Enter。 计算结果将显示在包含公式的单元格中。 1.2查看公式在单元格中输入公式时,该公式还会出现在编辑栏中。 要查看公式,请选择一个单元格,该单元格会出现在编辑栏中。1.3输入包含内置函数的公式选择一个空单元格..
2020-10-28 20:06:42 1229
原创 02. Excel_数据处理_基本操作(2)
数据处理--Excel基本操作(2)1. 选择空单元格并填充100开始 ---> 查找/选择 ---> 定位条件 ---> 空值 ---> 输入数据 ---> ctrl+enter2. 复制分类汇总结果(复制可见单元格,不显示隐藏数据)开始 ---> 查找/选择 ---> 定位条件 ---> 可见单元格3.将错误的单元格修改为0开始 ---> 查找/选择 ---> 定位条件 ---> 公式 ---> 错...
2020-10-28 14:17:11 513
原创 01. Excel_数据处理_基本操作(1)
数据处理--Excel基本操作(1)1. 保护功能工作簿 扩展名 xls excel97-2003版,可以有宏 xlsx excel2007-2016版默认的文件格式,不能有宏 xlsm excel2007-2016版默认的文件格式,能有宏 加密 文件 ---> 信息 ---> 保护工作簿 ---> 用密码进行加密(注意:如果不需要密码则不输入) 工作表(工作簿中的单元Sheet) 保护工作簿中结构不允许修改 审阅 ---.
2020-10-27 13:56:58 761
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人