- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 【HDFS】- 相关命令
pyspark把模型文件保存着爱hdfs上,管理这些模型文件需要执行一些命令。%shell# 查看hdfs根本目录 hadoop fs -ls /models# 在models下新建目录 test#hadoop fs -mkdir /models/test# 删除文件夹#hadoop fs -rm -r /models/blorModel2# 改变对应文件夹的权限#hado...
2018-10-31 15:20:42 218
原创 python爬虫---mac环境下的配置appium
装了一天的环境,只为了爬个app的数据,mac可以找的资料也是有点有限。 话不多说,只把相关环境变量的设置贴上来。其他的,网上有相关资料,可以查到。1. java环境变量配置查看java安装位置/usr/libexec/java_home –V# add java pathexport JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk...
2018-10-16 20:21:47 661
原创 PyPackage01---Pandas02_汇总和频数统计
单变量频数统计&多变量分组统计中的相关方法~1. count&unique&nuniqueimport pandas as pdtest_data = pd.DataFrame({ 'x1': ["a", "b", "c", "b"], "x2": [1, 2, 3, 4], "x3": [4, 3, 2,
2018-10-13 16:24:10 38392 5
原创 PyPackage01---Pandas06_取子集subset
简单的可以分为两类,一类是单纯的行,列取子集(以索引筛选);另一类是筛选出符合要求的子集。先介绍简单的行列subset,后介绍条件筛选。import pandas as pdx = pd.DataFrame({'x1':[1,2,3],'x2':[4,5,6],'x3':[7,8,9]})x x1 x2 x3 ...
2018-10-13 15:03:50 5626 1
winutils.exe&hadoop.dll
2019-12-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人