![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 60
我真的不叫苏图
保持热爱
展开
-
python 将多个Excel中的sheet合并
python 将多个Excel中的sheet合并import pandas as pdimport xlrdimport osimport xlrdfrom pandas import DataFramefrom openpyxl import load_workbookdfs =[]path=r"C:\Users\苏图\Desktop\流转表"file_name_li = os.listdir(r'C:\Users\苏图\Desktop\流转表')for fname in file_原创 2022-05-21 16:06:18 · 1236 阅读 · 0 评论 -
Python调用sqlAlchemy从sftp根目录传输文件到本地及数据库
Python调用sqlAlchemy从sftp根目录传输文件到本地及数据库代码已进行了注释,就不做太多的解释了#!/usr/local/bin/python3from smb.SMBConnection import SMBConnectionimport paramikoimport osimport pymssqlimport pymysqlimport datetimeimport timefrom time import mktimefrom smb.SMBConnection原创 2022-01-11 10:33:31 · 535 阅读 · 0 评论 -
查找字符串出现的路径-自用
import osimport sys,getoptimport timeimport csvimport pandas as pdtracer_path=sys.argv[1]t1 = time.time()tracer_line = []content_path = os.listdir(“tracer_path”)for i in content_path:tracer = pd.read_csv(“tracer_path” + i,“r”, encoding=‘utf-8’, h原创 2021-11-18 10:46:29 · 259 阅读 · 0 评论 -
数据分析-基于pandas(从将一个目录中的数据查找到另一个表中的对应的的func_name)
从将一个目录中的数据查找到另一个表中的对应的的func_name主要是利用pandas读取速度快,本问主要是利用pandas将1000万个数据去重后再另一个文件中查找到对应的数据import osimport sysimport timeimport csvimport pandas as pdt1 = time.time()tracer_line = []content_path = os.listdir( "/u/lushuai/work/sdp-parse/data/dco原创 2021-10-27 09:10:17 · 440 阅读 · 0 评论 -
机器学习--聚类(五种主要聚类算法)
机器学习–聚类(五种主要聚类算法)转载地址:https://www.sohu.com/a/225353030_99992181 原博文: 聚类是一种机器学习技术,它涉及到数据点的分组。给定一组数据点,我们可以使用聚类算法将每个数据点划分为一个特定的组。理论上,同一组中的数据点应该具有相似的属性和/或特征,而不同组中的数据点应该具有高度不同的属性和/或特征。聚类是一种无监督学习的方法,是许多领域中常用的统计数据分转载 2021-05-23 20:26:53 · 9526 阅读 · 0 评论 -
python简单图形界面GUI入门——easygui
python简单图形界面GUI入门——easygui转载地址:https://blog.csdn.net/mingqi1996/article/details/81272621 感觉gui做起来成就感比较高,学完基础语言顺便花一个下午看看GUI设计,现在回顾来看这个如果做正式的展示太过简单,easygui只是小演示之用。 下载 首先是easygui包下载,两种方式: 1)在p转载 2021-05-17 20:41:09 · 789 阅读 · 0 评论 -
打开 jupyter 时浏览器不能自动弹出,网页不显示问题解决
打开 jupyter 时浏览器不能自动弹出,网页不显示问题解决_Fanfan的博客-CSDN博客_打开jupyter不弹出浏览器 关于jupyter打开之后不能直接跳转到浏览器的解决方式 09-17 ...转载 2021-05-17 18:58:32 · 3952 阅读 · 0 评论 -
机器学习--集成学习(ensemble learning)原理及常见问题总结
机器学习–集成学习(ensemble learning)原理详解 在机器学习的有监督学习算法中,集成学习作为其中一员广泛应用于各个行业、领域。那么,什么是集成学习呢?首先假设我们的目标是学习出一个稳定的且在各个方面表现都较好的模型,但实际情况往往不这么理想,有时我们只能得到多个有偏好的模型(弱监督模型,在某些方面表现的比较好)。那么就要考虑到集成学习了。集成学习就是组合这里的多个弱监督模型以期得到一个更好更全面的强监督模型,集成学习潜在的思想是即便某一个弱分类器得到了错误的预测,其他的弱分类器也可原创 2021-05-16 13:43:52 · 2340 阅读 · 0 评论 -
机器学习--决策树理论与实战
这篇文章是关于决策树在sklearn中的实现和调参,里面穿插着关于本人对决策树的一些理解。开发环境用的是jupyter notebook决策树(Decision Tree)是一种非参数的有监督的机器学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据,在解决各种问题时都有良好表现,尤其是以树模型为核心的各种集成算法,在各个行业和领域都有广泛的应用。名字体温表皮覆盖胎生人类恒温毛原创 2021-05-09 16:46:20 · 499 阅读 · 0 评论 -
解决failed to execute [‘dot‘, ‘-Kdot‘, ‘-Tsvg‘], make sure the Graphviz executables are on your sys‘
解决failed to execute [‘dot’, ‘-Kdot’, ‘-Tsvg’], make sure the Graphviz executables are on your systems’ PATH在做决策树实战出现以上错误,主要解决方法如下:1.安装graphviz我主要是从官网安装graphviz,以Windows为例,官网地址为https://graphviz.org/download/#windows,我用的是64位,可根据自己的系统进行选择安装。2.配置环境变量电脑→属原创 2021-05-09 16:00:20 · 1520 阅读 · 0 评论 -
通过读取鸢尾花数据集,使用循环和子图绘制各个特征之间的散点图。 绘制各个特征的箱线图,查看是否存在异常值。
通过读取鸢尾花数据集,使用循环和子图绘制各个特征之间的散点图。 绘制各个特征的箱线图,查看是否存在异常值。iris数据集链接:https://pan.baidu.com/s/1nDgjWve6ktqdLWvOegvKRQ提取码:yd2ximport numpy as np import pandas as pdimport matplotlib.pyplot as pltdata = np.load('E://课程//数据挖掘建模//iris.npz',allow_pickle=True)da原创 2021-04-26 14:13:38 · 3557 阅读 · 0 评论 -
分析1996~2015年人口数据特征间的关系并分析1996~2015年人口数据各个特征的分布分散状况
python数据分析与应用实训1 分析1996~2015年人口数据特征间的关系运行环境:jupyter notebook数据:populations.npz链接:https://pan.baidu.com/s/123wS4QmhXAHGMUK5K-9evA提取码:1uv91.需求说明:人口数据总共有6个特征,分别为年份、年末总人口、男性人口、女性人口、城镇人口、乡村人口。查看各个特征随着时间推移发生的变化情况可以分析出未来男女人口比例、城乡人口变化的方向。2.实现步骤(1)使用库:NumP原创 2021-04-26 13:57:54 · 8223 阅读 · 5 评论