- 博客(88)
- 资源 (1)
- 收藏
- 关注
原创 机器学习系列笔记(六)
泛化理论 theory of generalizationbounding function B(N,K) :上限函数B(N,3) break point 在3上shatter 出现所有状况dichotomies有2个点 不能有2个break point ,shatter 有三种情况 有3个点, 不能有2个break point,shatter 有4种情况所有N个点,不能有有1个break poi
2017-11-03 14:49:57
287
原创 机器学习系列笔记(五)
learning 拆分为两个问题 一:我们如何可以让Ein(g)和Eout(g)足够接近? 二:如何让Ein(g)变的越来越小?M hyposesis的大小 M比较小的时候:good,p[bad<=2Mexp],bad 很少的选择 M比较大的时候:好的选择,坏事情发生的机率增加把hypotheses 分类 怎么分类 从一个Data 来看只有两种线 一种是判定它为是的线,否则反之.
2017-11-03 11:32:31
369
原创 机器学习系列笔记(四)
学习的可行性 学习是不可能的? 可能拯救 连接学习 连接到真实学习有多种情况解的问题.通过学习后的g怎么解释都可以, 比如说6/2(2+1)=9?1?这样的问题问一个有很多红色和绿色的弹珠,想知道红色弹珠的比例有多少sample 拿10个. 其中有多少red的那么有引伸出霍夫丁不等式 (hoeffding’s inequality) P[|v-u|>E]≤2exp(-2E²N)u是总共re
2017-11-02 14:35:14
301
原创 机器学习系列笔记(三)
学习的类型 是非题 (前面的银行发信用卡的例子) 2元分类的问题 more binary classification problems 信用卡发卡 垃圾邮件 判别病人是不是生病 广告收益是不是收益 答案对不对这是一类 把问题分为2类的问题 对与不对 从这里衍生 4元问题或者更多?–如何分别1分 1角 5角 一元的硬币 四种类型 可能从大小 重量来分辨? 那这里的输出 Y
2017-11-01 16:34:55
372
原创 机器学习系列笔记(二)
上一次的学习的回顾 我们把每个使用者x用一个向量来表示 这个x有很多个维度 在银行卡申请的案例中 x就是申请表, 那么x的维度有:年龄, 年薪,..etc. 那么我们给x所有的维度计算出一个分数, 如果这个分数超过了某个极限就发卡 就像考试, 每题都给你分数,加起来超过60就给你及格, 没超过就不及格, 如果这个题很重要,给分多一点注意到这里是小h 是可能的一个公式 那这里的thres
2017-11-01 14:26:41
313
原创 机器学习系列笔记(一)
学习是什么? 学习是通过大量观察得来的, 然后技能是通过大量的观察,然后学习,得来的 而机器学习就是主体变成人了. 通过机器的观察来学习(skill). 观察到的东西–>资料(data) data–>ML–>improved performers meaures 股票的大量数据–>ML–>预测更准确 机器学习的应用 分辨一颗树 定义一棵树 通过大量观察而定义一棵树用于, 不能手
2017-10-31 18:33:56
585
原创 项目搭建完整流程
1.使用工具生成基本框架 2.在./filter目录下生成一个.propreties文件 3.配置过滤器 在dispatcher-servlet.xml中添加过滤器文件 <mvc:interceptors> <mvc:interceptor> <mvc:mapping path="/**" /> <bean class="com.calanger.locker.
2017-10-25 16:52:48
1604
原创 TCP 协议 三次握手 四次挥手 数据传输
前言: 最近一段时间接触了websocket这种双工通信机制, 对于之前的完全使用http请求的我造成了一定的冲击,相关内容就不详述了,在代码逻辑上的一些编写也开始考虑更多的问题了,想了想,我想从TCP这种通信协议上入手,于是,又捡起来了原来丢弃的书,至于为什么丢弃,当然是,写的那么抽象,我只要背一遍里面的理念就好了,其他的根本看不懂。废话不多说,现在开始TCP:三次握手(建立通信)为什么要三次握
2017-10-17 15:41:03
469
原创 如何沟通
什么是沟通?百度百科上说是信息的双向同步什么是有效的沟通?通过听、说、读、写等载体 演讲、会见、对话、讨论、信件等方式 让对方接受别让我去想!如何有效沟通?首先确认沟通的目标! 比如我和同事被告知要去培训,而我不知道什么时候去培训,这里就是我的信息不同步,我需要去同步, 那么我就需要沟通! 那我这次的目的是想知道 我什么时候去参加培训? 但是 同事告诉我:”我不知道” 或者”在海淀区培
2017-10-13 15:14:17
402
原创 随TOMCAT启动 启动一个线程
建立一个类, 实现ServletContextListener接口 在web.xml里加上监听import javax.servlet.ServletContextEvent;import javax.servlet.ServletContextListener;public class socketMain implements ServletContextListener { @O
2017-09-06 10:19:31
2187
原创 TreeMap相关详解
如果只需要存储功能,使用HashMap与LinkedHashMap是一种更好的选择;如果还需要保证统计性能或者需要对Key按照一定规则进行排序,那么使用TreeMap是一种更好的选择。红黑树是为了维护二叉查找树的平衡而产生的一种树根节点与叶节点都是黑色节点,其中叶节点为Null节点每个红色节点的两个子节点都是黑色节点,换句话说就是不能有连续两个红色节点从根节点到所有叶子节点上的黑色节点数量是相
2017-08-14 14:32:31
491
原创 HashMap相关细节
HashMap是一种键值对(K-V)形式的存储结构.KEY AND VALUE 都可以为空KEY 重复会覆盖, VALUE 可以重复无序(不会按照PUT进去的顺序读)线程不安全static class Entry<K,V> implements Map.Entry<K,V> { final K key; V value; Entry<K,V> next; i
2017-08-14 11:27:14
317
原创 LinkedList相关细节
LinkedList允许空LinkedList允许重复数据LinkedList有序LinkedList非线程安全LinkedList是链表结构,这个在很多数据结构的书籍里都能知道的 就是有前有后有元素 pre next elementList<String> list = new LinkedList<String>(); list.add("111");增 在new Li
2017-08-11 16:05:58
315
原创 ArrayList相关细节
ArrayList是可以为空的ArrayList可以有重复数据ArrayList是有序的ArrayList线程不安全添加元素先判断是否要扩容在把元素放进去ArrayList的底层是基于动态数组实现的原因那么要扩容的话要扩多少呢? 源码里是在方法(ensureCapacity)里 int newCapacity = (oldCapacity * 3)/2 + 1;扩大了-->空间
2017-08-11 15:41:44
462
原创 lambda 初试探
Runnable r=()->System.out.println("hello lambda");这就是个样板lambda编程模版expression = (variable) -> actionvariable: 这是一个变量,一个占位符。像x,y,z,可以是多个变量;action: 逻辑代码部分也可以包含多个参数int sum = (x, y) -> x + y;这里就是用int 类型的
2017-08-11 15:11:25
341
原创 IDEA JVM 参数设置
在右上角选择 Edit Configurations然后在VM options 填写你的参数, 这里的 -XX:+PrintGCDetails 是让能够打印GC信息 然后就能在控制台看到信息了
2017-08-09 14:26:29
929
原创 线程池模型
其实,javaweb就是一个socket,这个socket监听并接受到达的http请求,请求接受后,可以封装数据,交给web层来处理这个请求 大概就会是一个socket线程监听请求,一旦接收到请求,那么就handlerRequest.然后封装一个respsonse返回. 因为只有一个socket线程,所以,如果返回一个response需要10ms 那么100ms的时间内只能返回10个请求 那么
2017-08-09 13:49:48
686
原创 怎么预防多线程出错
开始着手多线程的东西了.今天看到公司的一个C++ 前辈在写服务,凑过去瞧了瞧, 好帅气好多线程了, 突然想到他是要和我对接的这么多请求我处理的过来嘛,,所以多线程还没开始写, 就开始问一些怎么预防多线程出错“这么大量的插入我怎么防止出错啊”“首先建议索引唯一”“那这要两个字段才能联合标识唯一啊”“那你就建立联合索引啊.用navicat 很方便的.”“好的,那我去些插入sql了”“等一下,你要用什么方
2017-08-03 16:29:42
439
原创 spring boot 打包成jar 在服务器上运行
这次上面又给发布了个任务 ,搞一个中间件管理的后台,开放两个接口 一个是用于认证,一个用于流量上传, 由于只有3天时间,时间太过紧迫,于是前后端设计都自己来做 前端页面找了个bootstrap的页面来搞 我在这里找了个demo开始用 http://sudasuta.com/bootstrap-admin-templates.html然后用了热部署 <dependency>
2017-08-03 16:23:54
2528
1
原创 onethink 框架 更改数据库连接配置
/alidata/www/xxx/Apps/Common/Conf/config.php /alidata/www/xxx/Apps/User/Conf/config.php/alidata/www/xxx 项目安装目录
2017-06-12 22:54:32
1697
原创 发布项目至服务器
最近手头上的任务是让我把原来一个项目搬到新服务器上,只更改一下标题. 1.我用Idea 进行maven打包.一般打包至target目录下,在idea上运行成功都会在target目录下有个war包,这样就有了war包(其他的方法可以谷歌百度) 2.然后在服务器上我用的就是oneinstack一键部署,很方便实在.(使用说明官网上有的) 3.安装完成后新建项目. 比如www.ss22.com
2017-06-12 15:32:27
571
转载 JVM 调优常用命令
常用Shell命令查看网络状况netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'使用top去获取进程cpu使用率;使用/proc文件查看进程所占内存。#!/bin/bash for i in `ps -ef | e
2017-06-06 16:13:24
503
原创 URL和URI区别
URL(Uniform Resource Locator)即统一资源定位器,指向互联网资源的指针,是一种具体的资源。其一般的形式,如:scheme:[//host][:port][path][?query][#fragment]scheme包括:http、https、file、jar等。一个例子:file:/User/root/test.jar?time=123431212, 其中:schema为f
2017-05-26 17:15:53
465
原创 java动态代理之自我理解
动态代理 首先看代理两字,一般生活中所理解的代理就是,我给厂家代理卖东西,有人来我这买,他看不到后面的厂家的,意思就是他不知道厂家,不知道委托人,然后我做代理,我的客户都是我的朋友,所以又给过滤了一边客户。 那么有动态代理就有静态代理 静态代理就是在程序运行之前就存在的。 实现同一个接口public interface Sell { void sell(); void ad(
2017-05-26 16:10:07
409
转载 Chrome浏览器Network面板http请求时间分析
Chrome浏览器开发者工具Network窗口下,可以查看下载各组件所需的具体时间根据上表进行简要分析——Stalled(阻塞) 浏览器对同一个主机域名的并发连接数有限制,因此如果当前的连接数已经超过上限,那么其余请求就会被阻塞,等待新的可用连接;此外脚本也会阻塞其他组件的下载; 优化措施: 1、将资源合理分布到多台主机上,可以提高并发数,但是
2017-05-24 09:04:44
10857
原创 编码检查项目
编码问题可以说是程序员无法回避的问题,我相信即使是很有经验的程序员,也会被坑。没有办法,现实世界就是这么坑爹,只能寻根溯源,一一排查了。对于程序员通常,只要保证下面几点就没有问题了:指定网页的编码;配置web server对uri使用request里配置的编码;在ajax请求里先encodeURI();
2017-05-19 16:56:55
375
转载 Java GC笔记
Java堆是被所有线程共享的一块内存区域,所有对象实例和数组都在堆上进行内存分配。为了进行高效的垃圾回收,虚拟机把堆内存划分成新生代(Young Generation)、老年代(Old Generation)和永久代(Permanent Generation)3个区域。 新生代由 Eden 与 Survivor Space(S0,S1)构成,大小通过-Xmn参数指定,Eden 与 Survivor
2017-05-19 16:25:19
684
原创 JVM相关笔记
JVM 把内存分为几块不同的数据区 1.方法区 2.java堆 3.java栈 4.本地方法栈java 堆 是被所有线程共享的一块内存区域,主要是存放对象实例的. 那么怎么分,有两种办法, 1.指针碰撞 就是一大块.一次找到一块的大小,然后指针往后移这么大的, 2.空闲列表法 有的时候不是连续分配的. 所以就用一张表,记录下来哪些地方是空闲的.’然后创建对象是一个频繁的操作啊.
2017-05-19 14:40:00
302
原创 关于代码整洁的一些坑
近几天公司的事情渐渐的闲了下来, 然后闲来无事,准备把东西都整理一下. 尤其是代码部分,然后整理了一些code review的东西大家参考一下 最主要的事情是 **让别人能看懂你的代码1.单一职责单一职责很简单, 就是一个class做一件事情,把方法拆细,以便复用.2.一看就懂的命名这个就不怎么说了, 要是你代码里全是 a, b, c 谁看的懂你的代码3.一大串的参数??要是一个方法的
2017-05-12 14:55:56
335
原创 NosuchMethodError错误解决
今天遇到一个异常,是NosuchMethodError 在网上搜索解决方案,大部分都说是jar冲突. 然后我用idea的maven树来解决依赖关系右键点击diagrams 然后show dependencies ,然后找到报红线的jar 按shift+del 去解决依赖关系,然而并没有解决这个问题, 依然报错然后找到那个报错的类,xxx.class.getProtectionDomain().g
2017-04-10 10:25:40
809
原创 用户投票的排名算法
第一种 新鲜的delicious 新的难以上升, 第二种 上升的hacker P-1/(T+2)^G P投票数,T时间单位为小时,G重力系数一般为1.8(通常取值还有1.5,2.0 越大下降数度越快) 第二种 波动的Reddit lg z + yt/45000 t–>发表时间,是一个时间戳帖子越新,越大 z–>受肯定的程度 |赞成票-否定票| 如果相同就为
2017-03-29 12:36:32
1009
原创 高版本mysql向低版本mysql导入数据
今天遇到一个需求,原先开发一个原型项目的时候是放在国外的服务器上面, 然后这个项目成熟了之后想到国内来,提升页面浏览的速度.之前加载一个页面是这样的. 可以看见.这里的Content Download 居然到了20.87s 简直不可以忍受.然后排查问题发现,原因就是因为那个数据库是远程连接的数据库,在页面加载的时候,freemark也会循环去调用查询数据库的sql 由于是远程连接的sql,
2017-03-10 11:14:39
4307
原创 关于垃圾回收的一些看法
垃圾回收:GC 最近正好看到一些关于GC的介绍,然后查阅了很多相关知识.所以现在总结一下GC吧1.why? 为什么要有GC这么个东西,从读大学的时候,选课的时候有三门口摆在面前,C# C++ java 然后选择了Java 以至于在同一寝室内的室友学了C++ 天天抱怨要注意内存的问题, 而我学JAVA的一脸问号,什么内存,我怎么一点都没有在意? 后来才知道java内置了GC,
2017-02-28 09:58:50
768
原创 Dijkstra 算法 Java实现
最近看文章看到Dijkstra 算法,想起大学的时候学习的算法导论这门课程突然就想用java来实现下这个算法了,以下就来介绍一下这个算法吧.Dijkstra 算法主要是用来解决有向图单个点到其他点的最短路径的问题然后我根据这个有向图来编写了Dijkstra 算法public static void main(String[] args) { //定义一个有向图 //定
2017-02-23 14:03:25
934
原创 sql注入笔记
select length(id) from ot_picture LIMIT 1select database(),user(),VERSION(),@@version_compile_os;select TABLE_NAME from information_schema.`TABLES` where TABLE_SCHEMA='xinghui'select (select top 1 a
2017-02-23 10:44:59
385
原创 CSC压缩矩阵
1 0 4 0 3 5 2 0 6 一个简单的矩阵 Array(0, 2, 3, 6) Array(0, 2, 1, 0, 1, 2) Array(1, 2, 3, 4, 5, 6)Array(1, 2, 3, 4, 5, 6)–>表示按照列依次顺序排列非0元素 Array(0, 2, 1, 0, 1, 2)–>表示每一列非零元素所在的行号(从0开始) Arr
2017-01-10 14:48:36
3972
1
原创 关于机器学习的一点看法
传统意义上的对于计算机使用的方法是,给他一个指令让他做什么他就做什么. 但机器学习却不是这样的,事实上,机器学习是给他一堆数据,让他给点意见 比如,我要吃一块蛋糕,这个主要取决于两个条件,一个是这个蛋糕多少钱,我有没有这么多钱,还有一个条件是我饿不饿, 蛋糕多少钱是一个自变量,我饿不饿是也是自变量,我最后买没有买这个蛋糕是因变量. 解决一个问题是有3种方法,一个是问别人,一个是采用知识,最后一
2017-01-09 17:35:58
1346
原创 HIVE笔记
cat input/ncdc/sample.txt |ch02/src/main/ruby/max_temperature_map.rb|\sort |ch02/src/main/ruby/max_temperaterue_reduce.rbhadoop jar $HADOOP_INSTALL/conrib/streaming/hadoop-*.streaming.jar\ -input inpu
2017-01-06 11:30:15
382
原创 pig
是hadoop 的客户端,相当于 oracle 和plsql方便不熟悉java的用户可以排序,过滤,求和,聚组 pig latin 轻量级脚本语言sqlpig latinmap-reducecluster下载并解压pig mirror.bjtu.edu.cn/apache/pig下载完成后解压 配置Linux 系统环境变量 vi ~/.bash_profile vi /etc/profi
2017-01-04 14:07:46
549
原创 mybatis笔记
官方文档是这么写的 MyBatis是一款支持普通SQL查询、存储过程和高级映射的持久层框架。MyBatis消除了几乎所有的JDBC代码、参数的设置和结果集的检索。MyBatis可以使用简单的XML或注解用于参数配置和原始映射,将接口和Java POJO(普通Java对象)映射成数据库中的记录。 注意,这里空构造方法必须要有,SqlSession的selectOne方法查询一条信息的时候会调用
2016-12-29 09:31:12
476
Elastic Stack 实战手册、
2023-04-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人