- 博客(7)
- 收藏
- 关注
原创 Python基础学习-核心知识点
1. 操作列表1.1 遍历列表通过for循环对列表进行遍历:fruits = ['apple','orange','banana']for fruit in fruits: print(fruit)注意:注意缩进、不要漏掉冒号1.2 创建数值列表创建数值列表常用range()函数:ss = []for v in range(1,11): s=v**2 ss.a...
2018-05-04 10:33:04 357
翻译 Apache Spark Performance Tuning – Degree of Parallelism - spark 性能调优之partition
一般说来,spark并行任务量取决于分区数目。Spark Partition PrinciplesThe general principles to be followed when tuning partition for Spark application are as follows:Too few partitions – Cannot utilize all cores av...
2018-07-31 11:12:18 356
原创 配置两个两节点的HDFS集群
1.在两台服务器(sr405和sr406)上安装JDKyum search JDK yum install java-1.8.0-openjdk-devel.x86_64 -y 设置java环境变量(export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_112 export JRE_HOME=/usr/lib/jvm/jdk1.8.0_112/jre expor...
2018-07-30 15:30:17 940 1
转载 ssh可以登录。但是hadoop启动仍要输入密码
解决ssh配置无密码登录后 又出现输入密码的情况--Hadoop集群配置主机ip:192.168.163.100(hostname: node0)ssh无密码登陆的远程机ip:192.168.163.101(hostname: node1)首先要修改主机 和ssh连接到的远程机 的配置文件:vi /etc/ssh/sshd_config(要确保这些字符前无注释符号“#”)...
2018-07-30 14:59:26 1222
原创 研究移动用户APP操作行为的相关关系分析
数据采集为验证本系统采集情境数据的性能、可靠性和实用性,选取Application功能所采集到的情境数据进行不同用户安装使用的不同APP应用之间的关联关系。本研究主要研究对象是在校大学生及研究生,总计安装成功30个用户,成功收集到的有效数据28份,数据采集成功率达93.33%。本研究资料的分析是以关系网络分析方法研究各样本APP间的相关关系以及各种APP使用的频率规律。 本案例研究成功安装的2...
2018-05-05 13:53:28 3239
原创 用户行为分析-解决某游戏公司用户数量停滞问题,给出营销策略
1.问题提出:某游戏公司用户数量停滞问题,进行针对性运营策略2.业务目标:抽取目标用户集根据用户行为特征调整游戏运营策略增加用户游戏兴趣3.问题分析流程计算用户的业绩指标(KPI)提取用户行为特征提取重要特征属性(PCA降维)根据用户特征属性进行聚类发现不同用户群体(K-means聚类算法)计算每类用户的平均KPI4.分析结果4.1抽取用户行为分析所需用户集(过滤掉行为频率低的用户)将用户根据参与...
2018-05-05 09:53:24 1535
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人