- 博客(9)
- 收藏
- 关注
原创 pandas整理
1.lo[[ '交易日期', '开盘价', '最高价', '最低价', '收盘价']].idxmax(axis=1)2.lo[[ '交易日期', '开盘价', '最高价', '最低价', '收盘价']].idxmax(axis=0)5.lo[lo["昨收价"].isin([64.44,55])]#指定值进行一个判断,从而进行筛选。6.lo[(lo['最低价']>50)&(lo['最高价']>60)]#多重筛选。7.lo[lo['最低价']>50]#最低价大于50筛选出来。
2023-04-13 09:34:35
52
原创 整理缺失值
这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。因此,numpy可以用来进行数学运算(包括基本运算、矩阵运算等),数据处理,数据存储等。pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
2023-03-26 22:02:09
33
原创 Python面向对象
1、面向对象的编程---object oriented programming 简称:OOP,是一种编程的思想。OOP把对象当成一个程序的基本单元,一个对象包含了数据和操作数据的函数。面向对象的出现极大的提高了编程的效率,使其编程的重用性增高。 2、python面向对象的重要术语: 1、多态(polymorphism):一个函数有多种表现形式,调用一个方法有多种形式,但是表现出的方法是不一样的。 2、继承(inheritance)子项继承父项的某些功能,在程序中表现某种联系。 3、封装(encap
2023-03-06 09:13:23
42
原创 线性回归2.21
导入包 test_size数据的划分标准 random_state让数据只固定在那一部分 数据集的划分先x再y,先train再test return:None的意思是不需要返回值
2023-02-21 17:46:07
50
原创 线性回归2.20
安装pandas和sklearn包 conda create -n tcypython source activate tcy conda install pandas activate tcy进入tcy虚拟环境 conda install sklearn 安装其他包也是如此 在jupyter里面运行代码 import pandas as pd pd.__version__ 看pandas的版本,其他也如此,把pandas换了就👌 今天运行的代码
2023-02-20 21:42:39
26
原创 机器学习2-14
1.数据可视化六大工程 导入,清洗,特征工程(保留,创建,改造),算法建模,模型评估,可视化展示 2.kaggle是数据分析师比赛平台 3.shift+enter是快捷运行键 作业 1.jupyter快捷键将cell下的code改为markbook快捷键是按esc键进入命令模式。在命令行模式在,按m,y切换markdown和code模式。 2.
2023-02-15 15:45:48
30
原创 Anaconda安装
Anaconda的安装 1、下载 官网: https://www.anaconda.com/ 官网下载页: https://www.anaconda.com/produc
2023-02-14 00:18:39
39
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人