- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 python中pandas用法整理
1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:importnumpyasnpimport pandasaspd2、导入CSV或者xlsx文件:df=pd.DataFrame(pd.read_csv('name.csv',header=1))df=pd.DataFrame(pd.read_excel('name.xlsx'))3、用pandas创建数据表:df=pd.DataFrame({"id":[1001,1002,1003,1004,...
2021-04-20 10:13:00 1500
原创 大数据相关组件答疑
1、 HDFS文件读流程?(1)客户端通过调用FileSystem的open方法获取需要读取的数据文件,对HDFS来说该FileSystem就是DistributeFileSystem(2)DistributeFileSystem通过RPC来调用NameNode,获取到要读的数据文件对应的bock存储在哪些NataNode之上(3)客户端先到最佳位置(距离最近)的DataNode上调用FSDataInputStream的read方法,通过反复调用read方法,可以将数据从DataNode传递到客
2021-04-08 09:04:28 224
mysql 高效编程
2017-05-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人