Python数据分析
芷若初荨
每天进步一小点,跨越未来一大步!朝梦想不断前进!
展开
-
如何科学地评估和评判深度学习模型?
最近在考虑要发Paper,在模型的性能比较中,除了采用Precision/Recall的比较之外,为了进一步验证论文中的选择是存在可证明性的,因此考虑了使用F-test对多种模型算法进行统计显著性检验。常见的模型评估与方法误分率(misclassification rate),即准确度。精确率(precision)和召回率(recall)计算F1ROC曲线,ROC_AUCk-fold...原创 2019-10-22 17:05:36 · 2002 阅读 · 1 评论 -
Python数据分析-Numpy
Numpy特点——如果有想关注Java开发相关的内容,可以转我的博客 详细观看——Numpy作为使用Python进行科学计算的常用库,有着如下特点:提供了N维数组(矩阵),快速高效,矢量数学运算;高效的Index,不需要循环,因为底层实现采用了C语言开发。常见的数组和矩阵的方法数组和矩阵的创建与维度信息numpy.array()## 数组的创建vector = nump...原创 2019-09-25 15:46:11 · 269 阅读 · 0 评论 -
Python数据分析-Pandas
——如果有想关注Java开发相关的内容,可以转我的博客 详细观看——在学习了Numpy后,进行数据科学计算,为何还要使用Pandas呢?其实原因就是效率高,那为何Pandas效率比numpy要高呢?其实Pandas和Numpy还是有着很大的关系的,Pandas本身是依赖numpy的,而ndarray在内存里占据这一段连续的内存空间,任何改变ndarray长度的操作都势必让所有value改变内存...原创 2019-09-25 15:47:52 · 321 阅读 · 0 评论 -
Python数据分析-可视化“大佬”之Seaborn
——如果有想关注Java开发相关的内容,可以转我的博客 详细观看——Seaborn既然有了matplotlib,那为啥还需要seaborn呢?其实seaborn是在matplotlib基础上进行封装,Seaborn就是让困难的东西更加简单。用Matplotlib最大的困难是其默认的各种参数,而Seaborn则完全避免了这一问题。seaborn是针对统计绘图的,一般来说,seaborn能满足数...原创 2019-09-25 16:40:31 · 555 阅读 · 0 评论 -
Python数据分析-可视化“大佬”之Matplotlib
——如果有想关注Java开发相关的内容,可以转我的博客 详细观看——Matplotlib——Python可视化包折线图绘制折线图适合二维的大数据集,还适合多个二维数据集的比较,主要是用于反映数据的发展趋势变化情况。## 采用失业率的数据集进行绘制import numpy as npfrom numpy import arangeimport pandas as pdimport...原创 2019-09-25 16:39:35 · 298 阅读 · 0 评论 -
疑难杂症-使用pandas_profiling查看EDA数据文档遇到的一些坑
最近在学习特征工程相关的东西,发现pandas_profiling这个包特别适合直观地能够展示数据地很多细节的地方,包括缺失值等相关信息。然后,我就开始折腾pip install pandas_profiling发现一下子把原本好好的环境(Anaconda3.5、Python3)给折腾坏了(以上的表情包代表那时我的心情----蓝瘦香菇~),并且出现了以下几个问题,对此,我做了相关记录,今天并分享...原创 2020-03-06 10:44:21 · 2100 阅读 · 0 评论 -
下划线在Python中有哪些神奇的含义呢?
分享一篇文章:The Meaning of Underscores in Python。本文介绍了Python中单下划线和双下划线("dunder")的各种含义和命名约定,名称修饰(name mangling)的工作原理,以及它如何影响你自己的Python类。单下划线和双下划线在Python变量和方法名称中都各有其含义。有一些含义仅仅是依照约定,被视作是对程序员的提示 - 而有一些含义是由Py...转载 2019-10-09 12:39:29 · 361 阅读 · 0 评论