先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新Golang全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Go语言开发知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip1024b (备注go)
正文
df = pd.read_excel(‘file.xlsx’, sheet_name=‘Sheet1’)
上述代码中,file.xlsx
是要读取的Excel文件的路径和文件名,Sheet1
是要读取的工作表的名称。如果不指定sheet_name
参数,默认读取第一个工作表的内容。
Pandas还提供了一些其他的参数,用于控制读取数据的方式。例如,可以使用header
参数指定表头所在的行数,使用skiprows
参数指定要跳过的行数等。
读取Excel文件后,数据将存储在一个名为df
的DataFrame对象中。可以使用head()
方法来查看DataFrame的前几行数据:
print(df.head())
数据处理和清洗
一旦数据加载到Pandas的DataFrame中,我们可以对其进行各种处理和清洗操作。以下是一些常见的数据处理技巧:
选择特定列
如果只需要处理特定列的数据,可以使用DataFrame的列名进行选择。例如,要选择名为column1
和column2
的列,可以使用如下代码:
selected_columns = df[[‘column1’, ‘column2’]]
上述代码将选取column1
和column2
两列的数据,并将其存储在selected_columns
变量中。这样我们就可以只对这些列进行后续的处理。
过滤数据
有时候我们可能需要根据某些条件来过滤数据。例如,我们只想保留某个列中数值大于10的行。可以使用条件过滤来实现这一点:
filtered_data = df[df[‘column’] > 10]
上述代码将选择column
列中数值大于10的行,并将结果存储在filtered_data
变量中。我们可以根据需要修改条件来进行过滤操作。
处理缺失值
在实际数据中,常常会遇到缺失值的情况。Pandas提供了一些方法来处理和填充缺失值。例如,可以使用fillna()
方法将缺失值填充为指定的值:
df_filled = df.fillna(0)
上述代码将DataFrame中的所有缺失值填充为0。还可以使用其他方法来填充缺失值,例如使用前一个非缺失值填充或使用平均值填充。
数据转换
有时候我们需要对数据进行转换,例如将数据类型转换为其他类型,或者对数据进行重塑。Pandas提供了一些方法来实现这些转换。以下是一些常见的数据转换技巧:
- 将某一列的数据类型转换为数值类型:
df[‘column’] = pd.to_numeric(df[‘column’])
- 将某一列的数据类型转换为日期类型:
df[‘date_column’] = pd.to_datetime(df[‘date_column’])
- 对数据进行重塑,例如使用
pivot_table()
方法进行数据透视:
pivot_table = df.pivot_table(index=‘column1’, columns=‘column2’, values=‘value_column’)
这些是一些常见的数据处理和清洗操作,可以根据实际需求使用Pandas提供的方法和函数进行灵活处理。
数据分析和计算
Pandas不仅可以对数据进行处理和清洗,还提供了丰富的数据分析和计算功能。以下是一些常见的数据分析和计算技巧:
描述性统计
可以使用describe()
方法来计算DataFrame中数值列的描述性统计信息,例如计数、均值、标准差、最小值、最大值等:
stats = df.describe()
上述代码将计算DataFrame中数值列的描述性统计信息,并将结果存储在stats
变量中。
分组和聚合
Pandas提供了强大的分组和聚合功能,可以根据某些列的值将数据进行分组,并对分组后的数据进行各种聚合操作。以下是一些常见的分组和聚合技巧:
- 使用
groupby()
方法对数据进行分组:
grouped_data = df.groupby(‘column’)
- 计算每个分组中的平均值、总和、计数等:
group_stats = grouped_data.mean()
- 对多个列进行分组和聚合操作:
multi_group_stats = df.groupby([‘column1’, ‘column2’]).sum()
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip1024b (备注Go)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
化的资料的朋友,可以添加V获取:vip1024b (备注Go)**
[外链图片转存中…(img-pTAeHSNl-1713148960911)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!