python入门
文章平均质量分 75
小肥羊的慢慢科研路
希望这里能见证我的慢慢科研路
展开
-
利用python进行数据分析(第十章)
数据聚合与分组操作GroupBy机制分组键形式与需要分组的轴向长度一致的值列表或者值数组 DataFrame的列名的值 可以将分组轴上的值和分组名称相匹配的字典或series 可以在轴索引或索引中的单个标签上调用的函数计算分组的均值 GroupBy的 mean方法 size方法 返回一个包含组大小信息的series 遍历各分组for循环 dict(list(df.groupby('key')))选择一列或所有列的子集df.groupby('key')['data'] df.g原创 2021-04-12 19:59:40 · 293 阅读 · 0 评论 -
利用python进行数据分析(第八章)
数据规整:连接、联合与重塑分层索引简介一个轴向上拥有多个索引层级 是在更低维度的形式中处理更高维度数据的方式 在重塑数据和数组透视表等分组操作中有重要作用 unstack 重新排列df stack 反操作 每个轴都可以有分层索引 分层的层级可以有名称重排列和层级排列sort_index只能在单个层级上对数据进行排序 sort_index可使得结果按照层级进行字典排序 level=0从最外层进行排序按层级进行汇总统计df.sum(level='', axis= ) 使用了gro原创 2021-04-08 20:19:48 · 415 阅读 · 0 评论 -
利用python进行数据分析(第七章)
数据清洗与准备处理缺失值过滤缺失值:dropna一维删除缺失值 二维删除含缺失值行 参数how='all'删除所有值均为缺失值的行 参数thresh保留一定数量缺失值行补全缺失值:fillna默认返回新对象 inplace=True标识修改原对象 method='ffill'补全方法向前向后 limit=2填充范围数据转换删除重复值df.duplicated返回布尔类型series,标识该行是否之前存在 df.drop_duplicated返回df,删除重复列,默认保留第原创 2021-04-08 19:12:07 · 238 阅读 · 0 评论 -
利用Python进行数据分析(第五章)
Pandas入门Pandas用来处理表格型或异质型数据,Numpy处理同质型数值类数组数据结构:Series和DataFrameSeries:一维的数组型对象,包含值序列和索引(默认0~N-1,也可指定pd.Series([], index=[])) 也可认为是一组长度固定且有序的字典(pd.Series(字典)) 相比Numpy数组,可用索引选择数据 检查缺失数据:pd.isnull() 和pd.notnull() 特性:自动对齐索引 Series对象自身和索引都有name属性原创 2021-03-30 19:53:44 · 516 阅读 · 0 评论 -
利用Python进行数据分析(第四章)
NumPy基础:数组与向量化计算NumPy是Python数值计算中最为重要的基础包,提供了非常易用的C语言API他的设计对于含有大量数组的数据非常有效,数据存储在连续的内存块上,算法是C语言写的,无需任何类型检查和其他管理,使用内存也小可以对全量数组进行复杂计算而不需要写Python循环ndarray:多维数组对象一个快速灵活的大型数据集容器 可使用标量计算语法进行批量计算 shape属性:表征数组每一维度的数量 dtype属性:描述数组的数据类型,即元数据,数据的数据 生成nda原创 2021-03-25 20:20:22 · 266 阅读 · 0 评论 -
Python Pandas 问题集锦
(1)<ipython-input-29-689d63a5415c>:1: DtypeWarning: Columns (7,9) have mixed types.Specify dtype option on import or set low_memory=False.解决:df = pd.read_csv(path, encoding='gbk', low_memory=False)原创 2020-12-04 10:01:20 · 1479 阅读 · 0 评论 -
python入门3--数字--Casting--字符串
数字:数字类型--int、float、complex验证 Python 中任何对象的类型,使用 type() 函数Int 整数,正数或负数,没有小数,长度不限Float 浮点数,包含小数的正数或负数,可以是带有“e”的科学数字,表示 10 的幂Complex复数,用 "j" 作为虚部编写,x = 2+3j类型转换,可以使用 int()、float() 和 complex() 方法从一种类型转换为另一种类型注意!无法将复数转换为其他数字类型随机数Python 没有 rand转载 2020-06-04 21:15:38 · 354 阅读 · 0 评论 -
python入门2--变量--数据类型
变量:变量是存放数据值的容器没有声明,首次为其赋值时,才会创建不需要使用任何特定类型声明,甚至可以在设置后更改其类型字符串变量可以使用单引号或双引号进行声明命名规则--必须以字母或下划线字符开头,不能以数字开头,只能包含字母数字字符和下划线,区分大小写允许在一行中为多个变量赋值 x, y, z = "Orange", "Banana", "Cherry"可以在一行中为多个变量分配相同的值 x = y = z = "Orange"输出变量--print+ 文本和变量结合..转载 2020-06-03 21:34:42 · 186 阅读 · 0 评论 -
python入门1
摘抄w3school,开始学点新的东西Python 可以做什么?可以在服务器上使用 Python 来创建 Web 应用程序。 Python 可以与软件一起使用来创建工作流。 Python 可以连接到数据库系统。它还可以读取和修改文件。 Python 可用于处理大数据并执行复杂的数学运算。 Python 可用于快速原型设计,也可用于生产就绪的软件开发。为何选择 Python?Python 适用于不同的平台(Windows、Mac、Linux、Raspberry Pi 等)。 Pytho转载 2020-06-03 20:58:17 · 211 阅读 · 0 评论