系统数据类型
Hadoop他有自己的一套数据类型,该数据类型实在原有的Java的基础上进行封装,功能比之前的更加强大。
LongWritable
IntWritable
XXXWritable ->xxx 使用get方法获取
XXX -> XXXWritable 使用set方法获取
文本Text:长的字符串。
Text –>String : toString();
String ->Text : set()
自定义数据类型
(1)创建一个类,实现WritableComparable接口
UserTestWritable implements WritableComparable
(2)定义成员变量
(3)在最后面 为成员变量创建get/set方法
(4)完成序列化(write)和反序列化(read)的操作
(5)2个对象的比较方法compareTo
(6)toString将对象转出字符串。在打印对象的时候,会自动调用
网站日志分析
网站的基本指标
PV:pageview 浏览量(网页)
统计网站浏览页面的个数
每打开一个页面记为1,刷新3次,变成4。
有多少人试了多少件衣服
UV:unique visitor(人、用户)
统计网站一天内有多少人
同一个人不管访问多个页面,访问多少次都记录为1
有多少人到店里面了
VV:visit view 访客的访问次数。(依赖度、粘度)
记录一个人一天访问了多少次你网站
一天打开 微信、抖音APP的次数。
同一个人一天来店里多少次
IP:独立IP数
统计一天内有多少IP访问网站。
在同一个路由器上,所有人IP是一样的,这个指标误差会比较大
具有定位的功能