![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
斑点鱼 SpotFish
这个作者很懒,什么都没留下…
展开
-
VSCode中LeetCode插件测试报错[ERROR] http error [code=301]
vscode报错301解决方案转载 2022-12-30 11:57:20 · 526 阅读 · 1 评论 -
【python数据分析】数据建模之Kmeans聚类
K-means聚类:最常用的机器学习聚类算法,且为典型的基于距离的聚类算法。 K均值:基于原型的、划分的距离技术,它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度 Kmeans聚类案例分析:make_blobs聚类数据生成器# 导入模块fromsklearn.clusterimportKMeansfrom sklearn.datasets import make_blobs# 创建数据x,y_true=make_blobs(n_samples=300,...原创 2022-05-06 15:39:06 · 1107 阅读 · 0 评论 -
【python数据分析】数据建模之 PCA主成分分析
PCA主成分分析:最广泛无监督算法 + 基础的降维算法。 通过线性变换将原始数据变换为一组各维度线性无关的表示,用于提取数据的主要特征分量 → 高维数据的降维 PCA主成分分析:二维数据降维 / 多维数据降维 /主成分筛选二维数据降维# 加载主成分分析模块PCAfrom sklearn.decomposition import PCA# 数据创建rng = np.random.RandomState(8)data = np.dot(rng.rand(2,2),原创 2022-05-06 15:31:29 · 3207 阅读 · 0 评论 -
【python数据分析】数据建模之KNN分类
最近邻分类:在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别。KNN分类案例分析:电影分类from sklearn import neighbors # 导入KNN分类模块data = pd.DataFrame({'name':['北京遇上西雅图','喜欢你','疯狂动物城','战狼2','力王','敢死队'], 'fight':[3,2,1,101,99,98],原创 2022-05-06 13:50:31 · 624 阅读 · 0 评论 -
【python数据分析】:数据建模之线性回归
线性回归通常是人们在学习预测模型时首选的技术之一。在这种技术中,因变量是连续的,自变量可以是连续的也可以是离散的,回归线的性质是线性的。线性回归使用最佳的拟合直线(也就是回归线)在因变量(Y)和一个或多个自变量(X)之间建立一种关系。线性回归:简单线性回归 / 多元线性回归 /模型评估简单线性回归(一元线性回归)# 导入线性回归模块from sklearn.linear_model import LinearRegression# np.random.Rando原创 2022-05-06 13:37:41 · 1129 阅读 · 0 评论 -
【python数据分析】:数据预处理之连续数据离散化
连续属性变换成分类属性,即连续数据离散化。在数值的取值范围内设定若干个离散划分点,将取值范围划分为一些离散化的区间,最后用不同的符号或整数值代表每个子区间中的数据值。连续数据离散化:等宽法 / 等频法等宽法 :cut方法→ 将数据均匀划分成n等份,每份的间距相等举例:有一组人员年龄数据,希望将这些数据划分为“18到25”,“26到35”,“36到60”,“60以上”几个面元。ages=[20,22,25,27,21,23,37,31,61,45,41,.原创 2022-05-04 16:22:35 · 2923 阅读 · 0 评论 -
【python数据分析】:数据预处理之数据标准化
数据预处理之数据标准化原创 2022-05-04 15:07:46 · 2130 阅读 · 0 评论 -
【python数据分析】:数据预处理之异常值分析
本文主要是介绍如何找到异常值并将其可视化【异常值分析】原创 2022-05-04 15:04:22 · 1815 阅读 · 0 评论 -
【python数据分析】:数据预处理之缺失值填充实例
数据预处理之缺失值填充原创 2022-05-04 15:00:26 · 2576 阅读 · 0 评论 -
【python数据分析】:数据预处理之缺失值处理
数据处理之缺失值处理原创 2022-05-04 13:14:22 · 760 阅读 · 0 评论 -
用python制作上海疫情评论词云图-自定义形状
用Python制作词云图原创 2022-05-04 13:05:52 · 2214 阅读 · 0 评论 -
用python制作魔都头像生成器
用Python中的turtle作图原创 2022-05-04 09:50:30 · 314 阅读 · 0 评论 -
【python解决问题】分块读取:解决超大文件读取Memory error的问题
# memery errorf = open(path)data = pd.read_csv(path, sep=',',engine = 'python',iterator=True)loop = TruechunkSize = 1000chunks = []index=0while loop: try: print(index) chunk = data.get_chunk(chunkSize) chunks.append(chun.原创 2021-05-20 10:25:53 · 293 阅读 · 0 评论 -
【python自动化办公】获取当前周周一日期
import datetimeimport pandas as pddef get_current_week_monday(): monday, sunday = datetime.date.today(), datetime.date.today() one_day = datetime.timedelta(days=1) # 返回当前的星期一的日期 while monday.weekday() != 0: monday -= one_day .原创 2021-05-19 13:37:17 · 205 阅读 · 0 评论 -
【python办公自动化】批量合并excel文件
import pandas as pddf=pd.DataFrame()i=1for file in os.listdir(): dfi=pd.read_excel(file,header=0) df=pd.concat([df,dfi]) print('第%s个文件合并完成!'%i) i+=1原创 2021-05-18 17:24:07 · 62 阅读 · 0 评论 -
【python问题解决】seaborn中文显示问题,以及负号显示问题
plt.rcParams['font.sans-serif'] = ['SimHei'] # 中文字体设置-黑体plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题sns.set(font='SimHei',font_scale=1.5) # 解决Seaborn中文显示问题并调整字体大小...原创 2021-05-18 10:03:08 · 1303 阅读 · 0 评论 -
【零基础入门python】python环境搭建:anaconda+jupyter+vscode
【零基础入门python】python环境搭建:anaconda+jupyter+vscodepython学习第一步:搭建环境现在市面上有很多版本,工程派特喜欢pycharm。斑点鱼平时还会使用R和sql,所以没有选用pycharm,而是偏好vscode。环境配置:win10+anaconda3+python3.7+jupyter notebook+vscode1. anaconda...原创 2020-04-05 22:15:39 · 994 阅读 · 0 评论