![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 85
一一张xi
这个作者很懒,什么都没留下…
展开
-
【python办公自动化】task 04 python与pdf
目录1. 预备知识2. 批量拆分1. 预备知识Python操作pdf会用到两个库:PyPDF2 可以更好的读取、写入、分割、合并PDF文件pdfplumber 可以更好的读取 PDF 文件中内容和提取 PDF 中的表格在使用前需要先对其进行安装pip install PyPDF2pip install pdfplumber2. 批量拆分将一个pdf拆分为几个小的pdf,主要用到...原创 2021-06-26 22:54:30 · 111 阅读 · 1 评论 -
【python办公自动化】task3 Python与Word
目录1.word操作1.1 word基本介绍1.2 新建空白word并插入文字1.3 整体页面介绍1.4 字体设置1.5 插入图片与表格1.6 设置页眉和页脚1.7 扩展2. 实践预备知识使用前需要先安装python-docx库pip3 install python-docx1.word操作1.1 word基本介绍一个word文档的页面结构包括以下三个方面:文档-Document段落-Paragrapg文字块-Runpython-docx将整个文章看做是一个Document对象 ,其原创 2021-06-20 22:57:09 · 161 阅读 · 0 评论 -
【python办公自动化】task2 Python与Excel
目录1. Excel读取读取对应表格读取单元格读取多个格子的值2. Excel写入写入单元格并保存写入行数据并保存将公式写入单元格保存插入列数据插入行数据删除移动Sheet表操作创建新的Excel表3. Excel 样式设置字体样式设置对其样式设置行高与列宽合并、取消合并单元格使用前需要先安装相关模块pip install openpyxlexcel包含以下基本元素行Row列column单元格cell表sheet1. Excel读取读取对应表格打开已经存在的Excel表格 load原创 2021-06-18 22:24:04 · 174 阅读 · 0 评论 -
【python办公自动化】task01 文件自动化处理&邮件批量处理
目录1. 文件自动化处理1.1 读写文件1.1.1 文件与路径1.1.2 当前工作目录1.1.3 路径操作1.1.3.1 绝对路径和相对路径1.1.3.2 路径操作1. 文件自动化处理1.1 读写文件程序运行时候,可以用变量来保存运算结果,如果希望程序运行关闭后仍然能够查看,就需要将数据结果保存到文件中,下面将介绍如何使用python在硬盘上创建、保存、读取文件1.1.1 文件与路径文件有两个属性:路径:指明文件在极端就的位置,Windows中使用反斜杠“\”作为文件夹之间的分隔符号,OS原创 2021-06-16 22:30:04 · 511 阅读 · 2 评论 -
【数据挖掘】金融风控 Task05 模型融合
【数据挖掘】金融风控 Task05 模型融合5. 模型融合方法5.1 平均法5.1.1 简单的加权平均5.1.2 加权平均5.2 投票法5.2.1 简单投票5.2.2 加权投票5.3 stacking5.3.1 原理5.3.2 实例-鸢尾花分类5.4 blending5.4.1 原理5.4.2 Blending与stacking的不同5.4.3 案例-鸢尾花分类5.5 boosting/bagging5.5.1 boosting5.5.2 bagging5.6 总结与我的碎碎念5.7 参考资料模型融合即通原创 2020-09-27 21:29:27 · 527 阅读 · 0 评论 -
数据挖掘】金融风控 Task04 建模与调参
【数据挖掘】金融风控 Task04 建模与调参1. 常用模型对比及评估1.1. 逻辑回归与决策树模型1.2 集成方法1.2.1 bagging1.2.2 boosting1.2.3 bagging与boosting区别1.3 模型评估方法1.3.1 数据集划分条件1.3.2 数据集划分方法1.3.3 模型评价标准2. 模型训练2.1 导入数据并进行预处理2.2 使用lgb进行预测2.2.1 使用lgb进行预测2.2.2 对验证集进行预测,并画出roc曲线2.2.3 使用k折交叉验证进行模型评估2.3 模型调原创 2020-09-24 21:31:35 · 495 阅读 · 0 评论 -
【数据挖掘】金融风控 Task03 特征工程
【数据挖掘】金融风控 Task03 特征工程特征工程介绍数据预处理查找出对象和数值特征进行缺失值填充时间格式处理对象类特征的处理类别特征处理异常值的处理数据分箱固定宽度分箱分数位分箱卡方分箱和其他分箱方法的尝试特征交互特征编码特征选择学习地址:https: //github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl天池竞赛地址:https://tianchi.aliyun.com/comp原创 2020-09-21 20:29:22 · 921 阅读 · 0 评论 -
【数据挖掘】金融风控 Task02 数据分析
【数据挖掘】金融风控 Task02 数据分析学习地址:https: //github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl天池竞赛地址:https://tianchi.aliyun.com/competition/entrance/531830/introduction探索性数据分析目的了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深原创 2020-09-18 21:17:18 · 1883 阅读 · 0 评论 -
【数据挖掘】金融风控 Task01 赛题理解
数据挖掘之金融风控 Task01 赛题理解1.赛题介绍1.1赛题概况1.2 数据概况1.3 预测指标1.3.1 混淆矩阵1.3.2 准确率、精确率、召回率、F1 Score1.3 P-R曲线1.4 ROC曲线1.4 AUC面积1.5 金融风控常见评估指标1.4 赛题流程学习地址:https://github.com/datawhalechina/team-learning-data-mining/blob/master/FinancialRiskControl/Task1%20%E8%B5%9B%E9%A原创 2020-09-12 19:46:28 · 2103 阅读 · 3 评论