PPTV数据按照小类别分类

PPTV数据格式描述:

plt     int                       产品线,取值101,102,103,104,110,111,分别表示ipad,iphone,apad,aphone,windows客户端,网站
uidmd5  string
channelid       int
ipvalue string            
ipcity  string              城市
hour    string
minutesec       int      分钟秒
vv      bigint                 观看次数
wt_sec  double         观看时长
channel_titlechinese    string  频道名称
category_titlechinese   string 大分类名称
subcategory_titlechinese        string        子分类名称
playbackdurationseconds int  视频长度
directors       string  
actors  string
area    string
years   string    视频上线年份
description     string
dt      string       日期




110     b9cc9b9ae7e2faf07dddf7bdc1012aab        23662955        125.86.253.132 重庆    150701  23      3759    1       125.0  直播港澳台-20150701-希腊债务危机对中国有何影响?   焦点新闻       焦点新闻.热点播报      125     NA      NA      大陆    0      将一天最主要、最实用的资讯进行有效地编排整理传递给受众,既满足了听众对于信息的渴望,同时也希望对听众给予更多的帮助。
110     905899d72bf06b9b14ba5b8fe4b633db        23662959        125.122.210.149 杭州    150701  23      4232    1       68.0   超级访问-20150701-四位超模倾力加盟 展现私下的另一面       综艺   综艺.大陆综艺  2255    32657,李静|81382,戴军  NA      大陆    2000    明星,是观众永远关注的焦点,《超级访问》是一档访问明星以主持人为主的大型电视娱乐脱口秀栏目。本栏目不但有曾担纲多档综艺节目的主持人李静和著名歌手兼主持人戴军共同主持,还有京城一流的制作班底,大规模投入资金倾力制作《超级访问》被业内人士誉为中国最具原创风格的娱乐谈话节目。  《超级访问》做到了推陈出新、构思巧妙、个性突出。节目每期邀请一位家喻户晓的明星,来到精心设计的演播室,接受主持人全方位的访问。节目把演播室内的明星访谈与大屏幕播放的外景采访相结合,大胆的将娱乐与谈话巧妙融合。 《超级访问》,不一样的访问!电视娱乐脱口秀明星访谈节目《超级访问》将访问进行到底,期待您的关注。
101     af60ff66d2f29a998ba6e14a03893d80        23662959        119.100.35.208 黄石    150701  23      5741    1       1275.0 超级访问-20150701-四位超模倾力加盟 展现私下的另一面       综艺   综艺.大陆综艺  2255    32657,李静|81382,戴军  NA      大陆    2000   明星,是观众永远关注的焦点,《超级访问》是一档访问明星以主持人为主的大型电视娱乐脱口秀栏目。本栏目不但有曾担纲多档综艺节目的主持人李静和著名歌手兼主持人戴军共同主持,还有京城一流的制作班底,大规模投入资金倾力制作《超级访问》被业内人士誉为中国最具原创风格的娱乐谈话节目。  《超级访问》做到了推陈出新、构思巧妙、个性突出。节目每期邀请一位家喻户晓的明星,来到精心设计的演播室,接受主持人全方位的访问。节目把演播室内的明星访谈与大屏幕播放的外景采访相结合,大胆的将娱乐与谈话巧妙融合。 《超级访问》,不一样的访问!电视娱乐脱口秀明星访谈节目《超级访问》将访问进行到底,期待您的关注。
110     b9cc9b9ae7e2faf07dddf7bdc1012aab        23662965        125.86.253.132 重庆    150701  23      4456    1       9.0    直播港澳台-20150701-日本修订离岛放方针  焦点新闻   焦点新闻.热点播报      375     NA      NA      大陆    0       将一天最主要、最实用的资讯进行有效地编排整理传递给受众,既满足了听众对于信息的渴望,同时也希望对听众给予更多的帮助。
104     e4363b2de764b7a757ed702e56657943        23662965        180.140.86.225 桂林    150701  23      4602    1       375.0  直播港澳台-20150701-日本修订离岛放方针  焦点新闻   焦点新闻.热点播报      375     NA      NA      大陆    0      将一天最主要、最实用的资讯进行有效地编排整理传递给受众,既满足了听众对于信息的渴望,同时也希望对听众给予更多的帮助。


我们按照子分类名称对数据进行划分处理


Set<String>[] set = new HashSet[492];
Map<String,Integer> iMap = new HashMap<String,Integer>();
//Set<String> setx = new HashSet<String>();  
//Set<String> sety = new HashSet<String>();  
File file = new File("rst_150601");
File outfile = new File("out_3");
InputStreamReader reader;
OutputStreamWriter writer;
reader = new InputStreamReader(new FileInputStream(file),"utf-8");
writer = new OutputStreamWriter(new FileOutputStream(outfile),"utf-8");
String tempString = null;
int line = 0;
int cnt = 0;
BufferedReader br = new BufferedReader(reader);
while ((tempString = br.readLine()) != null) {
    //System.out.println("line " + line + ": " + tempString);
	line++;
	if(line <= 1)continue;
	//System.out.println(line);
	//writer.write(tempString + "\n");
	String[] tem = tempString.split("\t");
	//System.out.println(tem.length);
	if(tem.length != 19){
	//	writer.write(tempString + "\n");
	//	System.out.println(line);
		continue;
	}
	if(!iMap.containsKey(tem[11])){
		iMap.put(tem[11], cnt ++);
		set[cnt - 1] = new HashSet<String>();
		set[cnt - 1].add(tempString);
	}
	else {
		set[iMap.get(tem[11])].add(tempString);
	}
	//setx.add(tem[9]);
	//sety.add(tem[9]);
    //if(line == 5000000)break;
}
//System.out.println(tempString);

try{
    for(String key : iMap.keySet()){
    	int sid = iMap.get(key);
    	if(key.contains("未知")){
    		System.out.println(key);
    		key = key.split("/")[0];
    	}
    	writer = new OutputStreamWriter(new FileOutputStream(new File("./split/" + key),true),"utf-8");
    	for(String tKey : set[sid]){
    		writer.write(tKey + "\n");
    	}
    	writer.close();
    }
}
catch (FileNotFoundException ee){
	ee.printStackTrace();
	System.out.println("here");
}

//System.out.println("line:"+line);
reader.close();
writer.close();



最后得到划分后的每个小分类文件




对于分类处理好的小数据,抽取电视剧名称列表,然后根据他获取跟多的外部资源数据。


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
未来社区的建设背景和需求分析指出,随着智能经济、大数据、人工智能、物联网、区块链、云计算等技术的发展,社区服务正朝着数字化、智能化转型。社区服务渠道由分散向统一融合转变,服务内容由通用庞杂向个性化、服务导向转变。未来社区将构建数字化生态,实现数据在线、组织在线、服务在线、产品智能和决策智能,赋能企业创新,同时注重人才培养和科研平台建设。 规划设计方面,未来社区将基于居民需求,打造以服务为中心的社区管理模式。通过统一的服务平台和应用,实现服务内容的整合和优化,提供灵活多样的服务方式,如推送式、订阅式、热点式等。社区将构建数据与应用的良性循环,提高服务效率,同时注重生态优美、绿色低碳、社会和谐,以实现幸福民生和产业发展。 建设运营上,未来社区强调科学规划、以人为本,创新引领、重点突破,统筹推进、整体提升。通过实施院落+社团自治工程,转变政府职能,深化社区自治法制化、信息化,解决社区治理中的重点问题。目标是培养有活力的社会组织,提高社区居民参与度和满意度,实现社区治理服务的制度机制创新。 未来社区的数字化解决方案包括信息发布系统、服务系统和管理系统。信息发布系统涵盖公共服务类和社会化服务类信息,提供政策宣传、家政服务、健康医疗咨询等功能。服务系统功能需求包括办事指南、公共服务、社区工作参与互动等,旨在提高社区服务能力。管理系统功能需求则涉及院落管理、社团管理、社工队伍管理等,以实现社区治理的现代化。 最后,未来社区建设注重整合政府、社会组织、企业等多方资源,以提高社区服务的效率和质量。通过建立社区管理服务综合信息平台,提供社区公共服务、社区社会组织管理服务和社区便民服务,实现管理精简、高效、透明,服务快速、便捷。同时,通过培育和发展社区协会、社团等组织,激发社会化组织活力,为居民提供综合性的咨询和服务,促进社区的和谐发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值