Python数据分析
看黑马程序员教程写的心得
大大打打
这个作者很懒,什么都没留下…
展开
-
算法复杂度
算法复杂度的表示法:大O表示法,即:大写的O1. 常见的时间复杂度,按照一个算法中最复杂的步骤来判断2. 算法复杂度关系 和 表现原创 2022-01-08 16:03:05 · 274 阅读 · 0 评论 -
使用 Pandas 读取csv文件分析数据再写入到Excel中
#!C:\Users\JK\AppData\Local\Programs\Python\Python37-32# 导入必要的模块import pandas as pdimport os# 实现需要按下任意键才退出程序from pip._vendor.distlib.compat import raw_input# 设置:显示所有的分析内容(行, 列)pd.set_option('display.max_rows', None)pd.set_option('display.max_col.原创 2021-12-27 21:20:11 · 1658 阅读 · 0 评论 -
020 Pandas 常用统计方法
原创 2021-09-26 21:27:15 · 93 阅读 · 0 评论 -
Python数据分析总结
原创 2021-09-21 21:35:49 · 332 阅读 · 0 评论 -
019 numpy一些常用方法 和 统计函数
注意: 获取最大值和最小的的位置是 每一 列/行 最大值或者最小值的位置效果:原创 2021-09-21 20:35:59 · 73 阅读 · 0 评论 -
018 使用numpy进行数据拼接 和 数据交换
使用 numpy 进行数据拼接原创 2021-09-21 20:22:53 · 128 阅读 · 0 评论 -
017 pandas DataFrame数据综合练习
问题:统计911出警类型以及次数 数据形式 lat lng desc \0 40.297876 -75.581294 REINDEER CT & DEAD END; NEW HANOVER; Station ... 1 40.258061 -75.264680 BRIAR PATH & WHITEMARSH LN; HATFIELD ...原创 2021-05-04 20:19:51 · 145 阅读 · 0 评论 -
016 pandas DataFrame数据的索引操作
1. 重新设置索引 与 查询索引2. 将某一列设置为索引, 如果传入 drop=Fales 则不删除作为索引的那一列。 3. unique 去重,获取索引的唯一值,找出不重复的索引...原创 2021-05-03 18:51:42 · 114 阅读 · 0 评论 -
015 pandas分组与聚合
DataFrame 具有的 groupby 方法能够轻松的将数据分组数据格式: Brand Store Number Store Name Ownership Type Street Address \0 Starbucks 47370-257954 Meritxell, 96 Licensed Av. Meritxell, 96 City State/Province Country Postcode .原创 2021-05-03 18:26:50 · 66 阅读 · 0 评论 -
014 pandas按照 index 进行数据合并
1. Pandas 按照 index 进行合并重点:合并时 column 的参数不能相同,否则无法合并,必须存在相同的列相同才能合并 2.Pandas 按照 cloumns 进行合并内联接:inner默认情况下值按照 内联接 进行合并,取数据的交集外连接:outer ,取数据的 并集左连接:right ,以左边的为准,左边的数据有几行结果就有几行,左边没有的补充nan右连接:left ,以右边的为准,右边的数据有几行结果就有...原创 2021-05-03 15:03:16 · 4864 阅读 · 0 评论 -
013 将数据离散化
pandas将数据离散化要求统计:给出一个电影数据,将其中的所有电影,按照分类统计各类型电影的数量数据格式: Rank Title Genre \0 1 Guardians of the Galaxy Action,Adventure,Sci-Fi 1 2 Prometheus Adventure,Mystery,Sci-Fi 2 3原创 2021-05-02 21:57:25 · 124 阅读 · 0 评论 -
012 nan数据处理
注意点:在 dropna方法中, how 参数默认为 any ,意思时只要有一个 na 就全部删除一行, 可以改为 ‘all’ 删除全部为,一行数据全部为 nan 时才删除原创 2021-05-02 14:22:56 · 70 阅读 · 0 评论 -
011 DataFrame布尔索引
布尔索引原创 2021-05-02 14:20:04 · 475 阅读 · 0 评论 -
011 DataFrame位置索引
1. 基础索引信息import pandas as pddf = pd.read_csv('../youtube_video_data/dogNames2.csv')# 前5行信息# print(df.head())# 基础信息# print(df.info())# 总体描述# print(df.describe())# DataFrame中排序的方法df = df.sort_values(by='Count_AnimalName', ascending=False)# 方括原创 2021-05-02 14:06:16 · 415 阅读 · 0 评论 -
10 体验Pandas连接MySQL操作数据
Pandas连接MySQL操作数据import pandas as pdfrom sqlalchemy import create_engine# 要连接的数据库engine = create_engine('mysql+pymysql://root:191656@127.0.0.1:3306/class')# sql语句sql = 'MySQL语句'# 将要使用的语句与数据库连接sql_data = pd.read_sql_query(sql, engine)# 将读取的..原创 2021-05-02 13:46:13 · 90 阅读 · 0 评论 -
09 DataFrame 描述信息
1. DataFrame的基础描述信息: index、cloumns、values、shape、ndim等2.DataFrame的整体描述信息: info、describe、head、tail原创 2021-05-02 13:38:38 · 382 阅读 · 0 评论 -
08 pandas创建Series 和 DataFrame
DataFrame:Series 容器,每一行代表一条数据1. 创建 DataFrame ,传入数据为 类似 ndarray 或者 array-like 的数据2. 创建带索引的DataFrame3. DataFrame 传入字典作为数据,由于每一行代表一个数据,所以键作为 Columns4. 使用列表和字典创建DataFrame,缺失的地方补充nan5. 将读取的数据传入, 也是使用最多的...原创 2021-05-02 13:30:06 · 143 阅读 · 0 评论 -
07 numpy中nan的注意点
nan 是numpy中的一个特殊类型,当数据缺失时,numpy会在缺失的地方自动用nan填补原创 2021-04-26 20:42:38 · 102 阅读 · 0 评论 -
05 numpy中的随机方法
使用 numpy 创建全为 0 和 全为 1 的数组使用 numpy 找出一行或者一列中最大值或者最小值的位置,图中最大值都在每一列的第七为,最小值在每一行的第一位原创 2021-04-25 21:47:32 · 83 阅读 · 0 评论 -
04 numpy 索引拓展
1. 创建一个三行四列的数组2. 布尔索引,将 t2 中小于 10 的值替换成 1003. 找出数组中等于 100 的值4. 将数据赋值为 nan 类型报错原因:int 类型不能转化为 nan,需要用 astype 将其转化为 float 类型...原创 2021-04-25 20:56:28 · 66 阅读 · 0 评论 -
03 numpy读取文件、索引、切片
虽然不怎么使用numpy读取文件,但如果需要的时候还是蛮好用的import numpy as npfile_path = "文件路径"# delimiter 表示用什么分割数据, dtype 可以指定类型,否则会以科学计数法展示数据t2 = np.loadtxt(file_path, delimiter=',', dtype=int)print(t2)print('*' * 100)# 取一行# print(t2[2])# 取连续多行,取第三行之后的所有行# print(t原创 2021-04-25 20:43:58 · 108 阅读 · 0 评论 -
02 numpy数组的计算
注:reshape 方法具有返回值,不会改变原有数据import numpy as npt1 = np.arange(12)# [ 0 1 2 3 4 5 6 7 8 9 10 11]t1.shape# 输出(12,),表示 t1 是一个一维数组t2 = t1.reshape((3, 4))# [[ 0 1 2 3]# [ 4 5 6 7]# [ 8 9 10 11]]t2.shape# (3, 4),表示 t2 是一个二维数组t3 =原创 2021-04-24 13:48:37 · 63 阅读 · 0 评论 -
01 numpy数组的创建
numpy 能够生成数组,由于python是没有数组的概念的,所以可以理解为生成的是列表import numpy as npimport random# 创建numpy数据t1 = np.array([1, 2, 3])# [1 2 3]# <class 'numpy.ndarray'>t2 = np.array(range(10))# [0 1 2 3 4 5 6 7 8 9]# <class 'numpy.ndarray'># numpy特有的生成一.原创 2021-04-24 12:48:01 · 82 阅读 · 0 评论 -
Python数据分析之 Matplotlab 折线图
Matplotlab 在Python数据分析中实现数据可视化的工具from matplotlib import pyplot as pltimport randomfrom matplotlib import font_manager# 设置windows字体,在 windows 系统中查找路径myfont = font_manager.FontProperties(fname="C:/Windows/Fonts/STXINWEI.TTF")# 设置Linux字体,先用 fc-list .原创 2021-02-19 19:04:32 · 212 阅读 · 0 评论