关闭

梯度下降法解多元线性回归(C++) - CodeFight compute

https://codefights.com/challenge/wSfnufaxWqvauCvPd 提供测试 题意 : 已知有数据集包含多个工程师的信息,而对于每个工程师有engineer -> [y,x1,x2] 表示当其XP的值为x1,解决的题目为x2个时,可以开出y的薪水。请用多元线性回归,给出所查询工程师的薪水。 题解: 题目比较恶心的是最终参数要保留两位小数,所以并不是最拟合...
阅读(267) 评论(0)

Java简单操作mysql数据库代码存档+处理中文乱码问题

首先用的Maven框架,引包: mysql mysql-connector-java 5.1.17 jar compile         存档对mysql的基本读写操作 try { Connect...
阅读(259) 评论(0)

Spark Streaming 处理中文异常的解决方案

最近用Spark Streaming从Kafka接数据进行处理,是对中文的内容进行计算。发现处理时中文全变成了????????的形式,导致处理的结果和预期的不一样。但把数据放在redis或者放入下游的kafka topic,中文又正常了。为了防止是因为打日志的编码问题导致的判断出错,专门对算法进行了判断,的确就是对?????的东西处理了,而不是原中文字符串。     遇到这种情况,想到的就是编码...
阅读(475) 评论(0)

对决策树,随机森林的初步认识

决策树是常用的分类方法,其方法也非常的直观。每一次从父亲到孩子是对某个特征的分裂,对于树中的叶子,要么是已经为纯净的了(所有样本都属于同一类),或者没有特征可以分裂。对于后一种情况的出现,可以考虑将划分为该点样本属于最多的类。而对于一个分类问题可以构造出无限多的决策树,判定一棵决策树的好坏是看这颗决策树的深度越低越好。比如现在一款游戏的运行条件有各种各样的硬件软件需求,如果系统不是win10就无法...
阅读(206) 评论(0)

Spark Streaming 中使用kafka低级api+zookeeper 保存 offset 并重用 以及 相关代码整合

spark streaming 使用 kafka低级api维护offset 在...
阅读(1564) 评论(2)

Scala版SparkStreaming读写kafka,low level api模板代码存档

spark streaming从kafka的某个topic拉取数据,处理完后再放入某个topic中的一个模板,不完整,作为参考,加了部分备注。     SparkStreaming主程序模板 package jacob.sparkstreaming import java.util import _root_.kafka.serializer.StringDecoder...
阅读(1036) 评论(0)

用户行为日志的统计,Java mapreduce与Scala spark的代码存档...

原意是想存档一份spark的wordcount的代码,但觉得wordcount能体现出的东西少了一些,再加上写成spark遇到了各种各样的坑,索性就把之前写过的一个用java mapreduce写的用户行为日志统计的代码用scala的spark逻辑上大致实现了一次(不完全一致,有实现的细节差别),以证明初步写成一个spark程序。代码仅供参考map,reduce文件读写过程,由于缺少引用的相关包,...
阅读(629) 评论(0)

hadoop由于NodeManager无法启动而导致执行Jar包出现running job卡住的解决方案之一...

菜鸟上手大数据一头雾水...所以先自己用三个虚拟机搭建一个hadoop集群环境了 hadoop版本2.7.3 JDK版本8u101 系统CentOS7 基本按照 博文   其中有两个值得注意的地方(或者说勘误一下):    其一第8步的mapred-site.xml应为yarn-site.xml    其二还是第8步中关于yarn.nodemanager.resource.mem...
阅读(549) 评论(0)

2016百度之星初赛Astar Round2B - 区间的价值

题意: 定义一个区间的价值为区间的最大数*最小数。现给了n(1≤n≤100000)个数,问1~n长度的最大价值分别是多少。 题解:     用两个线段树以及快排的思想可以在O(nlog(n))的时间解决该题。     首先用线段树找到一个区间[L,R]的最大值位置为a与最小值位置为b,L,R]中所有包含[a,b]的区间的价值都为A[a]*A[b]。然后对[L,a-1],[a+1,R]重复这...
阅读(948) 评论(3)

Codejam Qualification Round 2016 - A,B,C题解

A - Counting Sheep 题意: 给一个数N,问这个数的多少倍后(假设为i),1~iN中0~9就都至少出现一次了。输出iN。 题解: 除了0不可能外,其他的都可以有,暴力的做就好 Code: #include #include using namespace std; int had[10]; int main(){ int T,cases,x,y,m; freop...
阅读(845) 评论(0)

Google APAC 2016 University Graduates Test Round D

之前的Round A晋级了...但是HR说今年7月因为Codejam的原因面过一次了不给再面了..所以Round C和Round B都没怎么做..这次最后一场Round D还是水了一发...虽然太弱了..水了两题...但还是拿了个通过笔试的邮件...虽然估计还是不会给面... A - Dynamic Grid 题意: 给了一个n*m的01矩阵...最大100*100...现在有100...
阅读(620) 评论(0)

Google APAC 2016 University Graduates Test Round A

今天手感还算不错,出了三个题,也有不顺的时候,要不第四题水个小数据或许可以混进前100。总的来说题目很简单,没有什么复杂的东西。 A - Googol String 题意: 目前只考虑包含'0','1'的字符串,有两个操作Switch与Reverse...其中Switch将其中的'0'变成'1','1'变成'0', Reverse将字符串反转 定义: S0="" Sn=Sn-1...
阅读(2300) 评论(7)

Google APAC 2016 University Graduates Test Practice Round APAC test

谷歌校招笔试的练习赛,题目很简单,应该只是用来熟悉环境的 题目链接A - Bad Horse 题意 有一些人,并且告诉一些二元关系,表示哪对人是不能属于一个组的,问可不可以将所有人分为两组。 题解 也就是给了一个图判断其可不可以表示为二分图了,根据二分图的性质知道存在奇圈的图就无法表示成,所以根据题意的二元关系作图后,找图中是否存在奇圈即可。Code:#include <io...
阅读(1180) 评论(1)

HDOJ 2222 - Keywords Search 更新AC自动机模板...用类来表示

题意:                    有n(          题解:                    裸AC自动机....空间限制略恶心..直接用指针会好一些....更新模板... Program: #include #include #include #include #define ll long long #define MAXNODE 242005 u...
阅读(621) 评论(0)

HDOJ 1058 - Humble Numbers 更新Treap模板..

题意:               定义质因数只为2,3,5,7为丑数...问第n大丑数是什么(1       题解:               由于大的数乘以2,3,5,7都不可能得到比其小的数...所以用一个总能保持有序的数据结构维护答案...初始为1..然后依次选出当前最小...乘以2,3,5,7后放入..               更新Treap模板....加了个找一个数字是否...
阅读(554) 评论(0)

HDOJ 5178 - pairs 离散化+树状数组..

题意:                          在一串数中X[1],X[2],.....X[n],问其中有多少对位a,b,满足a                  题解:                          主要思路很太常见,从第一个数开始往后首先询问在其前面的数有多少个各与其可以组成满足条件的对,再将其插入. 用线段树或树状数组维护.由于k很大,所以需要把所有的数离...
阅读(523) 评论(2)

水水微软苏州校招笔试 1月17日 题解..

A.Koch Snowflake          找规律...观察K2,K3可以得出在每个Ki中mod 4为2,3的将是当前最新出来的颜色,所以只需要不断的往前迭代直到当前标号迭代后所对应标号是某个Ki中mod 4为2,3的... #include #include #include #include #include #include #include #include #includ...
阅读(1752) 评论(3)

hiho一下 第二十一周 离散化与线段树回顾

题意:                       yo Program: #include #include #include #include #include #include #include #define MAXN 400005 #define oo 1000000007 #define ll long long using namespace std; int P...
阅读(690) 评论(0)

hiho一下 第十七周 最近公共祖先·三 更新RMQ在线解LCA

题意:                        裸LCA               题解:                       RMQ解LCA,其中F[]...
阅读(866) 评论(0)

Codeforces 268 B - Two Sets 搜索...

题意:                           裸LCA                  题解:                           tarjan离线解LCA模板......
阅读(763) 评论(0)
623条 共32页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:696677次
    • 积分:12382
    • 等级:
    • 排名:第1192名
    • 原创:620篇
    • 转载:3篇
    • 译文:0篇
    • 评论:179条
    最新评论