关闭

[置顶] 从小白到大数据科学家

参加北大“智能多媒体大数据研讨会”,听取很多业界大牛相关工作的分享。In some way,I got some information and it broaden my horizons.Then i will share my feeling.(题目是噱头,但也是一个收获) 1、重新认识大数据 今天报告涉及到很多方面:医疗(包括基于天河超级计算机的应用)、城市计算(主要是交通、环境监测)...
阅读(1026) 评论(1)

数据比赛 Pandas 相关用法

数据比赛 pandas...
阅读(19) 评论(0)

XGBoost中参数调优的完整指南(含Python-3.X代码)

CSDN:http://blog.csdn.net/kicilove/article/ Github:https://github.com/zhaohuicici?tab=repositories 原文链接:https://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-...
阅读(49) 评论(0)

机器学习十大算法总览(含Python3.X和R语言代码)

引言一监督学习二无监督学习三强化学习四通用机器学习算法列表 线性回归Linear Regression逻辑回归Logistic Regression决策树Decision Tree支持向量机SVM Support Vector Machine朴素贝叶斯Naive BayesK近邻KNN K- Nearest NeighborsK均值K-Means K-means如何形成群类 随机森林...
阅读(111) 评论(0)

信贷风险指标你都懂吗?

转自:http://www.jianshu.com/p/bb85af35d7db⊙风控基本概念⊙贷款不良率/不良贷款率⊙逾期率Vintage统计法(Now和Ever)⊙DPD1+,DPD30+,DPD60+,DPD90+...引言17年3月份的时候,有一篇文章曾经引爆金融界,称某国内知名互联网金融逾期率高达30%+,然后很快被澄清,为计算口径问题,真实逾期率只有1%+。某上市银行信用卡的某abs,...
阅读(88) 评论(0)

Mac上安装xgboost

毕业了工作一段时间了,好久没有写东西了。如果说一下从学校到职场的感受,就用经典的两个字可以描述--"围城"。没有什么都是自己想的那么好,直白点就是选择工作的时候一定要调研清楚,真正弄明白工作的真正性质,不要靠自己YY,否则工作了才发现不是自己想的那样就有点坑了。然而,目前发现我已经入坑了,所以以后工作还是彻底调研清楚,防忽悠! --------以上就当是简单吐槽下。 最近看了下机器学习相关的东东,发...
阅读(50) 评论(0)

Logstash之时区问题的建议和修改

大家在用Logstash收集日志时,发现@timestamp的时间比本地早8个小时,这是正常的,因为这个时间是UTC时间,日志应统一采用这个时间。 原则上建议大家不要修改这个时间戳: [plain] view plain copy 时区问题的解释      很多中国用户经常提一个问题:为什么 @timestamp 比我们早了 8 个小时...
阅读(1770) 评论(0)

长期运行Kibana

最近在搭建ELK平台,kibana是用tar包直接解压缩使用的方式安装的。但是安装完成后遇到一个问题就是如何让kibana后台运行,并且当断开ssh连接后,还能继续运行。后来想到了nohup命令。 nohup用法: 1 2 3 4 5 6 7 root@localhost:~ # m...
阅读(5813) 评论(0)

一份程序员的计划--可以参考

1.如何设计2016年的年度计划? 2.SMART原则是什么意思? 3.如何制定学习计划? 这两年,我一直非常感恩,也特别幸运的是2015年我的身体能够好起来,能够有机会回到我最热爱的工作中,所以从年初在医生的许可下,逐渐恢复工作开始,一方面告诉自己一定要把工作做好,一方面也时时提醒自己要保持好的心态,照顾好自己的身体、家人的健康。 回顾这一年,各方面的平衡做的不错。新...
阅读(659) 评论(0)

天天写业务代码,如何成为技术大牛?

转自:https://yq.aliyun.com/articles/61020?utm_campaign=wenzhang&utm_medium=article&utm_source=QQ-qun&utm_content=m_6490 摘要: 写在前面 不管是开发、测试、运维,每个技术人员心理多多少少都有一个成为技术大牛的梦,毕竟“梦想总是要有的,万一实现了呢”!正是对技术梦的追求,促使我们...
阅读(378) 评论(0)

Java中的多线程

如果对什么是线程、什么是进程仍存有疑惑,请先Google之,因为这两个概念不在本文的范围之内。 用多线程只有一个目的,那就是更好的利用cpu的资源,因为所有的多线程代码都可以用单线程来实现。说这个话其实只有一半对,因为反应“多角色”的程序代码,最起码每个角色要给他一个线程吧,否则连实际场景都无法模拟,当然也没法说能用单线程来实现:比如最常见的“生产者,消费者模型”。 很多人都对其中的一些概念不...
阅读(270) 评论(0)

求职系列1--树构造、遍历

最近面试被问到树相关的问题,哎,好久没看了,忽然间还不太容易写出来,这次就总结下树相关的操作。 1、树的构造(java) 树构造分为两部分: 一部分是树种节点,即Node节点,一般包括其Key、leftChild、rightChild,还可以自己构造一些方法,比如打印本节点的值。 第二部分即树,主要包括树的生成、查询节点、删除节点、更新节点、遍历节点,(本次主要针对树的生成,以及树的遍历来...
阅读(310) 评论(0)

实习用到的hive 相关sql

a.dt as `日期`,--日期 get_json_object(val_val,'$.ad_id')  as ad_id, --获取json内容 case order_from                  when 1 then 'app'                 when 2 then 'pc'             end as order_from,--订单...
阅读(301) 评论(0)

Elasticsearch-原理

转自:http://www.shaheng.me/blog/2015/06/elasticsearch--.html 一、概念 1.1 官方文档 以下总结自ElasticSearch的官方文档以及自己的一些实践,有兴趣的可以直接阅读官方文档: https://www.elastic.co/guide/en/elasticsearch/gui...
阅读(4640) 评论(0)

ES配置

ES集群内部节点访问,需配置: #network.publish_host为节点之间通信的IP地址network.publish_host: slave1 #discovery.zen.ping.unicast.hosts为节点之间探寻的集群范围discovery.zen.ping.unicast.hosts: ["master","slave1", "slave2"] 一般内部配置成内网...
阅读(353) 评论(0)

Centos6.5 iptables配置详解

1.什么是iptables iptable其实是Linux下的数据包过滤软件,也是目前最新Linux发行版中默认的防火墙。要想深入了解iptables机制,了解防火墙的规则是必不可少的。由于iptables利用的数据包过滤的机制,所以它会分析数据包的报头数据。根据报头数据与定义的规则来决定该数据包是进入主机还是丢弃。 也就是说,根据数据包的分析资料”对比”预先定义的规则内容,若数据包数据与规...
阅读(1519) 评论(0)
153条 共11页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:212281次
    • 积分:2906
    • 等级:
    • 排名:第13543名
    • 原创:69篇
    • 转载:84篇
    • 译文:0篇
    • 评论:13条
    最新评论