- 博客(21)
- 资源 (9)
- 收藏
- 关注
原创 python办公自动化-业务实操:xlwings解决excel批量插产品图的问题
近期,业务同事有个巨大的烦恼一直困扰着她,因使用频繁一直麻烦其他同事帮忙插图实在很不方便,她找到了斑点鱼帮她解决这个问题。业务同事A:斑点鱼,可以帮我修复excel宏插图错位的问题么?Spotfish:宏斑点鱼不会,斑点鱼可以用python对excel插图,但要按照规定格式来,你还需要吗?业务同事A:可以,只要不错位就行,不用再麻烦其他同事帮我跑图~Spotfish:好的,那斑点鱼就用Python跑一个程序,稍等哦~
2024-08-20 18:30:00 231
原创 【python数据分析】数据建模之Kmeans聚类
K-means聚类:最常用的机器学习聚类算法,且为典型的基于距离的聚类算法。 K均值:基于原型的、划分的距离技术,它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度 Kmeans聚类案例分析:make_blobs聚类数据生成器# 导入模块fromsklearn.clusterimportKMeansfrom sklearn.datasets import make_blobs# 创建数据x,y_true=make_blobs(n_samples=300,...
2022-05-06 15:39:06 1117
原创 【python数据分析】数据建模之 PCA主成分分析
PCA主成分分析:最广泛无监督算法 + 基础的降维算法。 通过线性变换将原始数据变换为一组各维度线性无关的表示,用于提取数据的主要特征分量 → 高维数据的降维 PCA主成分分析:二维数据降维 / 多维数据降维 /主成分筛选二维数据降维# 加载主成分分析模块PCAfrom sklearn.decomposition import PCA# 数据创建rng = np.random.RandomState(8)data = np.dot(rng.rand(2,2),
2022-05-06 15:31:29 4077
原创 【python数据分析】数据建模之KNN分类
最近邻分类:在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别。KNN分类案例分析:电影分类from sklearn import neighbors # 导入KNN分类模块data = pd.DataFrame({'name':['北京遇上西雅图','喜欢你','疯狂动物城','战狼2','力王','敢死队'], 'fight':[3,2,1,101,99,98],
2022-05-06 13:50:31 633
原创 【python数据分析】:数据建模之线性回归
线性回归通常是人们在学习预测模型时首选的技术之一。在这种技术中,因变量是连续的,自变量可以是连续的也可以是离散的,回归线的性质是线性的。线性回归使用最佳的拟合直线(也就是回归线)在因变量(Y)和一个或多个自变量(X)之间建立一种关系。线性回归:简单线性回归 / 多元线性回归 /模型评估简单线性回归(一元线性回归)# 导入线性回归模块from sklearn.linear_model import LinearRegression# np.random.Rando
2022-05-06 13:37:41 1167
原创 【python数据分析】:数据预处理之连续数据离散化
连续属性变换成分类属性,即连续数据离散化。在数值的取值范围内设定若干个离散划分点,将取值范围划分为一些离散化的区间,最后用不同的符号或整数值代表每个子区间中的数据值。连续数据离散化:等宽法 / 等频法等宽法 :cut方法→ 将数据均匀划分成n等份,每份的间距相等举例:有一组人员年龄数据,希望将这些数据划分为“18到25”,“26到35”,“36到60”,“60以上”几个面元。ages=[20,22,25,27,21,23,37,31,61,45,41,.
2022-05-04 16:22:35 3555
原创 【python解决问题】分块读取:解决超大文件读取Memory error的问题
# memery errorf = open(path)data = pd.read_csv(path, sep=',',engine = 'python',iterator=True)loop = TruechunkSize = 1000chunks = []index=0while loop: try: print(index) chunk = data.get_chunk(chunkSize) chunks.append(chun.
2021-05-20 10:25:53 306
原创 【python自动化办公】获取当前周周一日期
import datetimeimport pandas as pddef get_current_week_monday(): monday, sunday = datetime.date.today(), datetime.date.today() one_day = datetime.timedelta(days=1) # 返回当前的星期一的日期 while monday.weekday() != 0: monday -= one_day .
2021-05-19 13:37:17 215
原创 【python办公自动化】批量合并excel文件
import pandas as pddf=pd.DataFrame()i=1for file in os.listdir(): dfi=pd.read_excel(file,header=0) df=pd.concat([df,dfi]) print('第%s个文件合并完成!'%i) i+=1
2021-05-18 17:24:07 69
原创 【python问题解决】seaborn中文显示问题,以及负号显示问题
plt.rcParams['font.sans-serif'] = ['SimHei'] # 中文字体设置-黑体plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题sns.set(font='SimHei',font_scale=1.5) # 解决Seaborn中文显示问题并调整字体大小...
2021-05-18 10:03:08 1385
原创 【零基础入门python】python环境搭建:anaconda+jupyter+vscode
【零基础入门python】python环境搭建:anaconda+jupyter+vscodepython学习第一步:搭建环境现在市面上有很多版本,工程派特喜欢pycharm。斑点鱼平时还会使用R和sql,所以没有选用pycharm,而是偏好vscode。环境配置:win10+anaconda3+python3.7+jupyter notebook+vscode1. anaconda...
2020-04-05 22:15:39 1034
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人