数据科学库学习
文章平均质量分 73
WslWslYYX
这个作者很懒,什么都没留下…
展开
-
数据科学库--pandas中的时间序列
数据科学库--第六天应用pandas 中的时间序列 应用 统计911报警电话原因的分类 第一种方式:构建全为0的Dataframe import pandas as pd import numpy as np from matplotlib import pyplot as plt file_path = "./911.csv" df = pd.read_csv(file_path) #获取分类 temp_list = df["title"].str.split(":").tolist() cate_l原创 2021-10-05 21:58:22 · 113 阅读 · 0 评论 -
数据科学库--pandas中数据分组聚合,数据的索引,数据的合并
数据科学库--第五天实操数据的合并pandas中数据分组聚合pandas中数据的索引 实操 问题:分析统计一组电影数据的电影分类的情况 import pandas as pd import numpy as np from matplotlib import pyplot as plt file_path = r"F:\NLP项目\IMDB-Movie-Data.csv" df = pd.read_csv(file_path) # print(df["Genre"].head(3)) # 统计分类的列表原创 2021-10-03 15:53:01 · 180 阅读 · 0 评论 -
数据科学库学习--pandas常用数据类型,loc方法,pandas缺失值处理
数据科学库--第四天pandas的常用数据类型 pandas的常用数据类型 pandas是基于numpy数组构建的,但二者最大的不同是pandas是专门为处理表格和混杂数据设计的,比较契合统计分析中的表结构,而numpy更适合处理统一的数值数组数据。pandas数组结构有一维Series和二维DataFrame。 1.Series 一维,带标签数组 2.DataFrame 二维,Series容器 创建一个Series 例一: import pandas as pd t = pd.Series([1, 2,原创 2021-10-02 11:25:04 · 479 阅读 · 0 评论 -
数据科学库--numpy中对数组,文件的操作,索引和切片,对缺失值的处理,数据拼接,等其他方法
数据科学库--第四天numpy中的对数组的一些基本操作numpy对文件的读取操作 numpy中的对数组的一些基本操作 下面是numpy在对数组处理上的一些基本应用: import numpy as np import random t1 = np.array([1, 2, 3]) print(t1) print(type(t1)) t2 = np.arange(4, 10, 3) print(t2) print(type(t2)) print(t2.dtype) # numpy中的数据类型 t3 =原创 2021-10-01 18:04:22 · 177 阅读 · 0 评论 -
数据科学库学习--常用统计图,matplotlib绘制各种图形
数据科学库学习--第二天matplotlib 绘制散点图 matplotlib 绘制散点图 应用: 1.不同条件(维度)之间的内在关联关系 2.观察数据的离散聚合程度 代码: from matplotlib import pyplot as plt from matplotlib import font_manager # 设置中文字体 my_font = font_manager.FontProperties(fname=r'C:\Windows\Fonts\msyh.ttc') y_3 = [4,原创 2021-09-29 17:31:12 · 301 阅读 · 0 评论 -
机器学习数据科学库--数据分析流程,matplotlib
机器学习数据科学库--第一天数据分析流程matplotlib 数据分析流程 #mermaid-svg-Xwj0XDykfPec1fIv .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-Xwj0XDykfPec1fIv .label text{fill:#333}#mermaid-svg-Xwj0XDykfPec1原创 2021-09-24 22:23:57 · 124 阅读 · 0 评论