大数据开发2016年11-21到2016-12-29积累

2016\\11\\22

1.java如何获得linuxweb路径:

java获取根路径有两种方式:

1),servlet可以用一下方法取得:

request.getRealPath(/例如:filepach = request.getRealPath(///upload//;

2),不从jsp,servlet中获取,只从普通java类中获取:

String path =

getClass().getProtectionDomain().getCodeSource().getLocation().getPath();

SAXReader() saxReader = new SAXReader();

if(path.indexOf(WEB-INF)>0){

path = path.substring(0,path.indexOf(/WEB-INF/classes) 16);

// /WEB-INF/classes’为16

document = saxReader.read(path filename);

}else{

document = saxReader.read(getClass().getResourceAsStream(filename));

}

weblogic tomcat 下都有效

String path =

getClass().getProtectionDomain().getCodeSource().getLocation().getPath();

<!--EndFragment-->

2.crawler爬虫

https://en.wikipedia.org/wiki/Web_crawler

3.HTML DOM <go>方法:

http://www.w3school.com.cn/jsref/met_his_go.asp

HTML DOM <a>方法:

http://www.w3school.com.cn/html5/html5_a.asp

4.logger的四种方法

http://www.cnblogs.com/hym-pcitc/p/5674381.html

5. DMLDDLDCL区别

http://wenku.baidu.com/link?url=bBEYYtlGgPWeviEq1jPi89zhXuTkgmTz259MkQ9VpRsWHRrl2C_FozS1EvSGp1Zkia9Ludy2aoA7bq-E9uNOWY4-bUwmw9eq5Vovn6MV8TS

2016\\11\\23

1、 java爬取网页内容

 

http://blog.csdn.net/donglynn/article/details/47778009

2、 网页内容爬取:如何提取正文内容

http://www.tuicool.com/articles/e6j6Jf

3、 导入包出现错误是的处理方法:

将下载到的包在指定位置(依赖库)上删除之后更新maven项目即可

4、 新建maven项目是常见的错误:

每一个项目都有自己的artifactId,名字与项目名相同。如果引用了相同的artifactId会发生命名冲突。

2016\\11\\24

1HTML中的元素:

http://www.w3school.com.cn/html/html_elements.asp

2问题:

智联里有一个content,它不是我们定义的关于行业和工作的常量吗,我看51job给单独写了,数据的内容和格式我懂了,但是还是有几个不懂的问题:

1) 什么情况下需要单独写呢,还是针对每个招聘网站都需要写它的类呢?

根据业务需要,不同情况写不同的。

2) 这些数据是如何获取的呢?

是对网页进行分析的时候用到的,可以形成笛卡儿积,通过枚举确定出筛选的条件,用于网页的过滤。

3)这个文件是用于保存数据时分类所用呢,还是有其他的目的?

网页筛选。

 

2016\\12\\06

1、如何maven依赖的jar包:

百度:maven repository

进入官网即可

 

2016\\12\\07

1、mysql 赋给用户权限 grant all privileges on

http://blog.csdn.net/wengyupeng/article/details/3290415

2016\\12\\09

1、java.net.SocketException 的五种异常

http://developer.51cto.com/art/201003/189724.htm

 

2httpHTTPS的区别

http://jingyan.baidu.com/article/95c9d20d92a74eec4f75614f.html

2016\\12\\12

1java如何爬取网页

http://jingyan.baidu.com/article/3c343ff7e823850d377963bc.html?qq-pf-to=pcqq.group

2、 SqoopSQLServer数据导入HBase

http://blog.csdn.net/nma_123456/article/details/50524619

3java写入文件的三种方法

http://blog.csdn.net/wgw335363240/article/details/5678965

4、HTTPS百度百科

http://baike.baidu.com/link?url=yAuwT9DKmXly4bEvtn0jznb5wImDJgKhU95F66NSXKU4ZbnA8w-GzDGWt8RcdxhmSrVo6x_PqjOOGssMuRqB8a

5、SSL/TLS协议运行机制的概述

http://www.ruanyifeng.com/blog/2014/02/ssl_tls.html

 

6、HttpClient请求Https协议:

http://www.blogjava.net/sxyx2008/archive/2011/07/08/353940.html

7Java反射异常处理之InvocationTargetException

http://blog.csdn.net/zhangzeyuaaa/article/details/39611467

8、 java动态替换代理IP

http://justdo2008.iteye.com/blog/796290

9、 copy /b命令无缝合并多个文件

http://www.360doc.com/content/14/0212/22/9849466_352039289.shtml

 

 

2016\\12\\29

1、查看标准值及其编号

http://10.129.20.101:9200/_plugin/head/

2Eclipse下安装Scala2.10.4插件

http://www.bubuko.com/infodetail-900521.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
淘淘商城是一个综合性的B2C平台,类似与京东、天猫商城,其打造的是商业模式为“社区+电子商务”, 用户不只是在社区中有自己的圈子,还可以将电商加入到社区中,整个电商网站实现的功能非常之多,采用分布式的系统架构设计,包括后台管理、前台系统、购物车系统、订单系统、单点登录系统、搜索系统、会员系统等。 1、 该项目采用了分布式系统的架构,目前,在大型网站中使用非常广泛。 2、 各个系统之间采用接口调用的方式进行交互,即:面向服务的开发,每个团队、系统,分工明确,各司其职。 3、 后台系统使用了目前主流的框架技术,Spring、SpringMVC、Mybatis实现,开发更有效率,网站性能更高。 4、 后台系统中的前端UI采用了Jquery EasyUI完成,界面更加的美观。 5、 系统后台使用多级菜单布局,并使用KindEditor框架作为富文本编辑器。 6、 前台系统中采用CSS+DIV技术开发界面,使用Jquery完成和动态效果和后台服务的数据交互。 7、 项目引入了内容关系系统的概念,实现了对网站大部分内容的管理维护,使开发更加的高效。 8、 使用单点登录系统(SSO)来实现集群状态下的用户数据的维护。 9、 使用高性能的KV数据库Redis完成数据的存储以及缓存,提高数网站整体的性能。 10、 使用企业级开源系统Solr完成商品以及订单数据的搜索。 11、 在数据库存储方面使用MySQL的主从复制架构,使用Spring的AOP实现数据的读写分离,以保证在“读多写少”的场景下的高性能。 12、 使用高性能的企业级消息系统RabbitMQ,完了系统间的通信,使得系统间的耦合度大大降低。 13、 部署方面使用LVS + keepalived + Nginx实现了双机主备、双主热备,实现了一个高可用的系统架构。 14、 项目开发采用团队式的开发,统一使用Maven私服构建项目,使用统一的SVN服务进行代码的管理。 【课程内容】 项目功能实现分析 RESTful Web Service、SVN 项目讲解、环境搭建 后台系统功能实现 前台系统搭建、实现、内容管理系统实现 Redis入门 单点登录系统 订单系统、Quartz入门 Solr入门以及搜索系统实现 MQ学习、改造搜索、商品详情缓存逻辑 实现购物车、读写分离 dubbo入门、优化单点登录系统 分布式部署架构讲解以及实施 分组实战 + 项目总结以及就业指导 拔高--Redis集群、Tomcat优化、MySQL优化

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值