Python数据分析
文章平均质量分 60
Python 数据分析笔记
何为xl
发布简单小项目和自己的学习笔记
展开
-
【ASE】笔记总结
ASE 介绍ASE 的安装文件格式的转化命令行操作图形界面操作Python代码操作[2]支持的文件转化格式ASE(三):图形界面查看/建立/修改结构图形界面召唤查看结构python代码查看/建立结构读写、查看结构建立结构分子周期性体系utm_id=0read(),write()函数,作用分别是:将结构信息读取为atom object,将atom object写入文件;atom_object.get_positions()函数,可以获取atom object中所有的原子坐标信息,数据形式为列表;原创 2024-06-14 13:19:14 · 1217 阅读 · 0 评论 -
【Anaconda】 anaconda常用命令总结
中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/阿里云 http://mirrors.aliyun.com/pypi/simple/注意:将下面的可以将 env_name 替换为自己想命名的虚拟环境名。env_name为自己对应的环境名。还有一种格式是yml文件。原创 2024-06-10 00:08:02 · 836 阅读 · 0 评论 -
【Python】pycharm报错——Error loading package list:Unexpected end of file from server
pycharm报错——Error loading package list:Unexpected end of file from server。镜像地址不要添加太多,但凡有一个不能用,就会报错。原创 2024-06-08 17:57:04 · 316 阅读 · 0 评论 -
【Jupyter】Jupyter notebook 打开创建好的虚拟环境
其中,myenv是你创建的虚拟环境名称。这个命令将在jupyter中注册一个新内核,使得jupyter能够使用你的虚拟环境。如果你已经注册了内核,您会看到一个包含你的虚拟环境名称的选项卡在jupyter的右上角。其中,myenv是你创建的虚拟环境名称。如果虚拟环境已激活,你会看到虚拟环境名称出现在命令提示符的开头。2、确认你已在虚拟环境中安装了jupyter。3、确认你已经在jupyter中注册了虚拟环境。1、确认你已经激活了虚拟环境。原创 2024-05-08 10:49:05 · 492 阅读 · 0 评论 -
【Python】python通过cmd创建虚拟环境(pip方式)
当我们在进行python项目开发的时候,为了不让项目间的python环境产生冲突,这是需要配置虚拟环境,从而使项目与项目之间的包相互隔离,互不影响。原创 2023-08-08 15:09:06 · 6449 阅读 · 2 评论 -
【Pandas】修改列名、移动列的位置、删除列
修改dataframe列名的两种方式:若修改所有的列名建议使用第一种,只修改少数几列的名字,建议使用第二种.但这种方式不会修改原本的Dataframe,要使用inplace=True在原Datafram上进行更改。原创 2022-08-13 10:38:35 · 8995 阅读 · 0 评论 -
【Pandas】对比两列取最大值生成新的一列
假设 dataframe 中有如下两列,如何生成第三列 best,其值取scheme1与scheme2 对应的最大值。原创 2022-08-13 09:33:36 · 3748 阅读 · 0 评论 -
【Pandas】AttributeError: ‘Series‘ object has no attribute ‘boxplot‘
最近在对某列数据绘制箱型图时,遇到如下问题:报错:解决方法: 改为dataframe再绘制箱线图转载 2022-06-12 18:46:26 · 1784 阅读 · 0 评论 -
【Pandas】 ValueError: Unable to parse string “2,00“ at position 3769
问题:在使用 pandas 对 dataframe 的 Object 对象进行数据转换为 数值型,在此我使用的是 to_numeric() 函数运行后报错:从报错可知,这是由于“2,00”这种字符串有逗号导致转换失败。解决代码:原创 2022-06-12 10:26:16 · 3758 阅读 · 0 评论 -
Python Fitter 判断数据样本的分布函数拟合
Python fitter包:拟合数据样本的分布安装fitterFitter方法参数详解HistFit类:适合密度函数本身Python拟合数据样本的分布github项目:https://github.com/cokelaer/fitterfittle 说明文档:https://fitter.readthedocs.io/en/latest/references.html#安装fitterpip install fitter生成一段模拟数据from scipy import statsdat原创 2021-05-09 23:14:42 · 7389 阅读 · 10 评论 -
【Python】 matplotlib 以pdf形式保存图片
【Python】 matplotlib 以pdf形式保存图片import matplotlib.pyplot as plt from matplotlib.backends.backend_pdf import PdfPages # short versionplt.plot(range(10))plt.savefig('plot.pdf') # long versionpdf = PdfPages('des_file_name.pdf') plt.figure()plt.his转载 2021-04-13 22:39:56 · 1541 阅读 · 0 评论 -
【Python】ValueError: Expect x to be a 1-D sorted array_like.
这里写自定义目录标题转载至:https://blog.csdn.net/weixin_39777626/article/details/88232790常出现在机器学习数据训练中,原因是 x轴数据 有问题,常见原因是出现了重复项(函数定义X只能对应一个Y值,Y能对应多个X值,所以允许Y有重复项,不允许X有重复),此时最好查重,然后根据情况做出调整示例原码def interp(x,y,xi): f = interpolate.interp1d(x, y,fill_value="extrapo转载 2021-04-11 15:32:56 · 1568 阅读 · 0 评论 -
【机器学习】 sklearn 模块详解
【机器学习】 sklearn 模块详解前言小白问题解决机器学习一般问题的步骤sklearn 概述sklearn dataset模块预处理 sklearn.preprcessing特征抽取 sklearn.feature_extraction特征选择 sklearn.feature_selection降维 sklearn.decomposition模型评估 sklearn.metrics分类结果度量回归结果度量多标签度量聚类的度量交叉验证 sklearn.model_selection网格搜索 sklearn原创 2021-03-27 19:08:16 · 5328 阅读 · 0 评论 -
python数据集获取与基本使用(sklearn自带的数据集、UCI数据集)
sklearn自带的数据集以及生成数据集自带的小数据集鸢尾花数据集:load_iris():用于分类任务的数据集手写数字数据集load_digits()乳腺癌数据集load-barest-cancer()糖尿病数据集波士顿房价数据集体能训练数据集:生成数据集sklearn 的数据集种类自带的小数据集(packaged dataset):sklearn.datasets.load_可在线下载的数据集(Downloaded Dataset):sklearn.datasets.fetch_计算机生成的数原创 2020-12-23 11:48:28 · 29795 阅读 · 0 评论 -
python词云实现
python词云实现安装相关包数据高级用法安装相关包首先需要安装三个包,可以使用pip命令进行安装:pip install matplotlibpip install jiebapip install wordcloud数据安装了 Python 的运行环境,我们还需要数据。词云分析的对象,是文本。理论上讲,文本可以是各种语言的。英文、中文、法文、阿拉伯文……为了简便,我们这里以英文文本为例。本次使用python的部门英文介绍为例。文本内容如下,并存储到"python.txt"文件中原创 2020-12-10 19:55:49 · 993 阅读 · 0 评论 -
【Python 】Python 读取HDF5文件
h5文件格式,HDF 的版本 5(HDF 版本 5不与 HDF 版本 4 及早期版本兼容).HDF是什么呢?就是Hierarchical Data Format,可以存储不同类型的图像和数码数据的文件格式,并且可以在不同类型的机器上传输,同时还有统一处理这种文件格式的函数库。大多数普通计算机都支持这种文件格式。原创 2020-11-15 10:23:42 · 23928 阅读 · 0 评论 -
pandas 之 to_csv 保存数据出现中文乱码问题及解决办法
data.to_csv('className_time.csv')(1)使用 df.to_csv(file_name2, encoding=‘utf-8’) 后还是编码有问题data.to_csv('className_time.csv', encoding='utf-8')(2)使用 df.to_csv(file_name2, encoding=‘utf_8_sig’) 后中文乱码问题解决了关于utf-8与utf_8_sig的区别:UTF-8以字节为编码单元,它的字节顺序在所有系统中都原创 2020-08-14 17:46:25 · 7026 阅读 · 0 评论 -
python数据分析之matplotlib使用
python 可视化使用第三方包MatplotlibSeabornPandasBokenPlotlyVispyVega和gega-lite原创 2020-08-02 00:27:10 · 1008 阅读 · 0 评论 -
numpy中的matrix与array的区别(Matlab矩阵运算对比)
matrix与array的区别1. 定义(维基定义)数组矩阵numpy定义numpy.ndarraynumpy.matrix2. 乘法运算类型及其定义1. 定义(维基定义)数组数组(英语:Array),是由相同类型的元素(element)的集合所组成的资料结构,分配一块连续的内存来存储。利用元素的索引(index)可以计算出该元素对应的储存地址。没有规定数组维度-->可以是任意的,eg:一维,二维,多维etc矩阵数学上,一个m×n的矩阵是一个由m行n列元素排列成的矩形阵列。规定了矩阵维原创 2020-07-31 19:52:38 · 2097 阅读 · 0 评论 -
python数据分析 —— numpy使用
Python的第三方扩展库,是其他数据分析模块的基础,主要用于数组、矩阵计算(比列表快得多)等方面。Numpy提供的内容包括以下几部分:1、一个强大的N维数组对象Array,也就是ndarray;2、较为成熟的函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。NumPy是一个运行速度非常快的数学库,它的主要功能就是数组计算。Nu...原创 2020-07-31 18:22:22 · 1433 阅读 · 0 评论 -
graphviz安装与python中的调用(Windows版本)
graphviz安装与python调用安装 Graphviz验证 graphviz 是否安装成功基本绘图入门python 使用 graphviz注: graphviz 包的安装问题graphviz这个包,使用 pip install graphviz 安装后是不行的,这只安装了graphviz的pyhon调用接口,使用的话还需要下载graphviz的安装文件。在决策树模型的部署中,使用sklearn库提供的现成方案是省事的方法,但为对其进行可视化操作,使用pydotplus-Graphviz库必不可少原创 2020-06-01 01:01:21 · 5197 阅读 · 0 评论 -
numpy中轴的理解与计算
对数组的轴和轴计算的理解在学习numpy的时候,最难理解的就是轴的概念,我们知道坐标系中有轴的概念,那么两个轴是否有关联呢?为了便于理解,特写此博客进行梳理。理解轴(1)二维数组 2维数组,axis=0,横轴;axis=1,纵轴;如果是3维及以上的多维数组,先最外层,然后一层一层按照先横轴再纵轴的逻辑进行匹配轴。import numpy as npa = np.array([[1...原创 2020-03-15 01:26:57 · 1325 阅读 · 0 评论 -
Python随机数生成之random, numpy使用
Python中随机数的生成在Python中可以用于随机数生成的有两种主要途径,一是random模块,另一个是numpy库中random函数。random模块random模块中将近有7个函数都是可以用来生成随机数的:① random.random()功能:随机生成一个 [0,1) 的浮点数import randomnumber = random.random()print(numbe...原创 2020-03-13 16:10:26 · 877 阅读 · 0 评论