1、导出消息记录:打开“消息管理器”,选中好友后,执行“导出聊天记录为文本文件”
2、设计聊天记录存储结构:
CREATE TABLE P_TALK_MSG(
P_ID NUMBER(10) PRIMARY KEY,
P_NAME VARCHAR2(16),
P_TIME DATE,
P_MSG VARCHAR2(512)
);
CREATE SEQUENCE SEQ_TALK
INCREMENT BY 1 -- 每次加几个
START WITH 1 -- 从1开始计数
NOMAXVALUE -- 不设置最大值
NOCYCLE -- 一直累加,不循环
CACHE 10;
INSERT INTO P_TALK_MSG VALUES(SEQ_TALK.NEXTVAL,'TEST_NAME',SYSDATE,'TEST_MSG');
3、根据消息记录,得到INSERT语句:
首先查找:^(.*俊星)\r\n(.*)$,将之替换为:$1___$2
再次查找:^(2009-12-.*\d{2}) (.*)___(.*)$,将之替换为:
INSERT INTO P_TALK_MSG VALUES(SEQ_TALK.NEXTVAL,'$2',TO_DATE('$1','yyyy-MM-dd hh24:mi:ss'),'$3');
4、将INSERT语句执行到数据库后,执行下面统计:
-- 消息数目
-- 1:消息总数
SELECT COUNT(*) FROM P_TALK_MSG;
按 人分布
SELECT COUNT(*),p_name FROM P_TALK_MSG GROUP BY p_name;
按 日期分布
SELECT COUNT(*),to_char(p_time,'yyyy-mm-dd') FROM P_TALK_MSG GROUP BY to_char(p_time,'yyyy-mm-dd');
-- 消息字数
SELECT SUM(length(p_msg)) FROM P_TALK_MSG;
按 人分布
SELECT SUM(length(p_msg)),p_name FROM P_TALK_MSG GROUP BY p_name;
按 时间分布
SELECT SUM(length(p_msg)),to_char(p_time,'yyyy-mm-dd') FROM P_TALK_MSG GROUP BY to_char(p_time,'yyyy-mm-dd');
-- 消息中,汉字
SELECT SUM(length(get_chinese(p_msg))) FROM P_TALK_MSG;
按 人分布
SELECT SUM(length(get_chinese(p_msg))),p_name FROM P_TALK_MSG GROUP BY p_name;
按 时间分布
SELECT SUM(length(get_chinese(p_msg))),to_char(p_time,'yyyy-mm-dd') FROM P_TALK_MSG GROUP BY to_char(p_time,'yyyy-mm-dd');