自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 合并pdf所有页面,解决PyPDF2版本 3.0.1问题

pdf合并,PyPDF2版本更新3.0.1问题

2023-06-15 20:34:58 561

原创 xlsx批量重命名

批量修改名字

2023-04-28 17:23:29 149

原创 批量截取PDF指定页面

批量截取PDF指定页面

2023-04-28 17:11:25 353

原创 python 转xlsx和合并文档

excel,仅自用记录一、python实现xlsx批量转xls(或者xls批量转xlsx)参考:python实现xlsx批量转xls(或者xls批量转xlsx)import osimport win32com.client as win32# 输入目录inputdir = u'C:\\批量转'# 输出目录outputdir = u'C:\\所有xls'if not os.path.exists(outputdir): os.mkdir(outputdir)# 三个参数:

2022-05-12 10:28:42 244

原创 excel批量改名字(含识别区分)

excel文件批量改名字

2022-05-12 10:02:48 1068

原创 二、样本不平衡+模型选择

样本不平衡的模型选择

2020-12-27 17:54:16 3593 3

原创 一、数据预处理

python数据预处理

2020-12-22 19:14:37 304

原创 虚拟环境的使用和pyspider的安装

最近安装的包需要的版本经常不同,因此记录有关虚拟环境的设置和使用。使用的是anaconda环境1. 使用虚拟环境在cmd中输入:查看已有的虚拟环境列表:conda env list输出如下:查看所有环境: conda info -e创建:conda create --name 环境名称 python=3.8激活:conda activate 环境名称退出:deactivate删除:conda remove -n 环境名称 --all使用镜像:指定下载镜像pip install -

2020-12-11 12:05:52 438

原创 python第三章 05_2.numpy的操作

numpy的操作import numpy as npvector = np.array([5, 10, 15, 20])vectorarray([ 5, 10, 15, 20])类型及转换数据格式汇总及type, astype, dtype区别https://blog.csdn.net/sinat_36458870/article/details/78946053查看数据类型 df.dtypevector.dtypedtype('int32')转换数据类型 df.astyp

2020-12-01 17:44:31 249 1

原创 python第三章 05_1 numpy的创建和索引

numpy的创建以及属性索引numpy 的介绍和数据类型创建 array 以及从已有数据创建 zeros,ones,empty 函数numpy.arrangenumpy 的切片和索引bool 索引以及数组索引numpy 的介绍和数据类型 np.array()import numpy as npvector = np.array([5, 10, 15, 20])# 构造一个 ndarray matrix = np.array([[5, 10, 15], [20, 25, 30],

2020-12-01 17:43:45 163

原创 python第三章 04 Pandas的常用操作

DataFrame 的常用操作一转置更改类型排序值替换import pandas as pddata = {'性别':['男','女','女','男','男'], '姓名':['小明','小红','小芳','大黑','张三'], '身高':[178,173,165,188,156], '年龄':[20,20,25,24,29]}df = pd.DataFrame(data)df 性别

2020-12-01 11:17:21 546 1

原创 python第三章:03 pandas索引和常用操作

pandas 的索引索引是非常重要的一个功能,使用索引我们就可以对数据进行选取和筛选四种索引形式:使用位置做索引使用列表做索引使用切片做索引使用bool类型索引** A、选取行: **使用 loc 或者 iloc 函数来实现import pandas as pdfilepath = '销售客户信息.xlsx'df = pd.read_excel(filepath)df 用户ID 注册时间 性别

2020-12-01 11:16:41 191

原创 python第三章 02-04pandas总结

1.DataFrame 的创建1.多维列表创建2.数组字典创建1.多维列表创建import pandas as pdarray = [[1,2,3],[3,4,5]]df = pd.DataFrame(array)dftype(df)#pandas.core.frame.DataFrame2.数组字典创建dict = {'name':['datafrog','data','frog'],'age':[18,19,18]}df = pd.DataFrame(dict)df2

2020-12-01 11:12:48 183

原创 python第三章:01 jupyter的使用

创建虚拟环境a、创建指定python版本的虚拟环境conda create -n env_name python=3.6(版本可以任意指定,网上会下载)b、虚拟环境命令conda env list查看当前拥有的虚拟环境conda remove -n frog_36 --all 删除虚拟环境activate frog_36 进入虚拟环境conda deactivate 退出虚拟环境Cell 单元知识:Cell有四种功能:Code、Markdown、Raw NBConvert、Heading

2020-12-01 11:07:26 415

转载 Excel:第十一天求和函数(Sum函数)

一、基本用法1、区域求和方法一:输入公式sum方法二:按快捷键alt+=2、不连续的区域求和方法一:输入sum(区域一,区域2,…)注:每个区域用逗号隔开,最多支持255个区域求和;3、利用名称框进行求和对区域进行命名——输入公式=sum(名称框)4、累计求和(数量与单价)方法一:分别进行求和,最后总计方法二:输入公式=sum(区域一*区域二),最后按ctrl+shift+回车键构成数组;5、无法求和的sum方法一:文本转数值,再进行求和方法二:利用负负得正的运算方法,将文本转.

2020-11-22 10:44:38 1701

转载 Excel:第六天通过分列快速提取有效信息

一、基本用法1、分隔符号ps:将一个单元格内的内容根据同一个特征,分隔每个字段step:【选中区域】——【分列】——【分隔符号】——【分隔符号:选择其他:/】——【下一步:选择放置目标区域】——完成2、固定宽度ps:将一个单元格内的内容,分隔字段step:【选中区域】——【分列】——【固定宽度】——【数据预览:建立分割线】——【数据预览,选中数字区域,修改列数据格式:文本】——完成二、进阶用法1、关键词拆分ps:将省和市分开单元格step:【选中区域】——【分列】——【分隔符号】—.

2020-11-22 10:34:59 448

转载 Excel:第二天 不为人知的排序和高级用法

作者:小筠筠链接:https://www.jianshu.com/p/7478c16283b6来源:简书一、基本用法(一)排序的基本用法①鼠标放在需排序的单元格上,点击右键—选择升序或降序或其他选项②【数据】—【排序】旁边的小图标,进行升降排序③【数据】——【排序】——【选择主要关键词】(二)刷选的基本用法①筛选包含1的数字很简单,在搜索框中输入1即可。②筛选以1开始的数字在搜索框中输入1*,这里*是通配符,可以是任意多个字符③筛选以1结尾的数字在搜索框中输入*1④筛选4位的

2020-11-22 09:50:57 433

转载 Excel:第一天快捷键使用

作者:小筠筠链接:https://www.jianshu.com/p/22184b004332来源:简书一共有82个常用快捷键,这里我截取了32个必须要掌握的。2.常用快捷键3.快速访问工具栏方法一:鼠标放在快速访问工具栏上,再点击鼠标右键,可添加或删除快速访问工具栏方法二:通过【文件】—【选项】—【快速访问工具栏】进行单个添加或者多个导入快速访问工具栏创建好后,如何使用快捷键呢,按ALT就就可以调出快速访问工具栏,然后看你添加的工具对应的号码;4.自定义功能区通过【文件】—【.

2020-11-22 09:44:36 149

原创 面板数据分析复习总结

一、混合回归和固定效应模型和随机效应模型类型、特点、基本假定、模型估计、模型设定检验、检验判定二、固定效应模型和随机效应模型的不同点三、SUR模型、SWAMY模型、HSiao模型类型、特点、基本假定、模型估计、特点四、平均个体回归模型和平均时间回归模型五、各种检验的优缺点...

2020-11-20 13:46:34 940

原创 常用的统计分析方法总结(聚类分析、主成分分析、因子分析)

一.聚类分析聚类的目的1.间隔尺度:变量用连续的量来表示【常用】2.有序尺度:有次序关系,指标有有序的等级来表示3.名义尺度:指标用一些类来表示,这些没有等级和数量的关系1.1聚类分析的类型Q型聚类:对样品的聚类R型聚类:对变量的聚类1.2聚类分析按研究方法分类1.系统聚类法:由N类–1类2.分解法:由1类—N类3.K-均值法:事先在聚类过程中确定在K类,适用于数据量大的数据4.有序样品的聚类:N个样品排序,次序相邻的样品聚成一类5.模糊聚类法:模糊数学的方法,多用于定性变

2020-11-20 13:30:28 16073

原创 爬虫整理1

一.Chrome的开发者工具1.1界面介绍打开快捷键Fn+F12Elements: 从浏览器的角度查看渲染的HTML、CSS、DOM对象Network: 页面向服务器请求了哪些资源、资源大小以及加载资源的相关信息,HTTP的请求与返回内容。点击name 可以出现【headers】提取URL和最后的【user-agent】如图所示:sources: 源代码面板 调试JAVAscriptconsole:控制台面板:显示各种警告与错误信息,可实现shell在页面上与ja

2020-11-20 13:26:54 84

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除