ddxygq的博客

待我代码写成,便娶你为妻!

自定义博客皮肤

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Gitment给基于hexo的yilia主题的博客搭建免费评论系统

交了3年的女朋友不理我了,她说我连SVM都不会? 我的博客用的是搜狐的畅言,功能确实非常强大,但是很多功能我用不上,也不会用,有两个问题:1)评论需要登录,有门槛;2)页面底部有广告。严重影响视觉体验。 点击站长去广告吧,跳到了付费页面: 49元一个月,这不是要我命吗?就这吊样,你说...

2019-01-15 21:37:04

阅读数 2463

评论数 18

SpringBoot + thymeleaf 实现分页

SpringBoot结合Thymeleaf实现分页,很方便。 效果如下 后台代码 项目结构 1. 数据库Config 由于hibernate自动建表字符集为latin不能插入中文,故需要在application.properties中指定:spring.jpa.properties.hiber...

2019-09-04 20:25:21

阅读数 31

评论数 0

Python批量删除mysql中千万级大量数据

## 场景描述 线上mysql数据库里面有张表保存有每天的统计结果,每天有1千多万条,这是我们意想不到的,统计结果咋有这么多。运维找过来,磁盘占了200G,最后问了运营,可以只保留最近3天的,前面的数据,只能删了。删,怎么删? 因为这是线上数据库,里面存放有很多其它数据表,如果直接删除这张表的数据...

2019-09-03 20:18:35

阅读数 46

评论数 0

项目实战:使用Python的Flask模块快速开发一个web入门小项目

平时做数据分析挖掘的结果,难免会需要在Web上展示出来,这样更有逼格。那么,开发web页面难吗?使用Java开发门槛太高,一堆注解绝对让你投降;使用PHP开发,好像太骚了。其实,我们需要有这么一个工具,既能做数据分析挖掘,又能做web展示,非你莫属了——Python。 这里,选择Python的轻...

2019-08-31 12:55:01

阅读数 12

评论数 0

GIT 常用命令

分享一个大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到人工智能的队伍中来! 学无止境,精益求精! 十年河东,十年河西,莫欺少年穷! 学历代表你的过去,能力代表你的现在,学习代表你的将来! 本篇博客是转发的别人的,原文地址:http://www.ruanyif...

2019-07-24 22:01:31

阅读数 15

评论数 0

蒙特卡洛方法

我的个人博客 蒙特卡罗方法是一种计算方法。原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。最经典的莫过于圆周率π的计算了。 圆周率π的计算 单位圆面积为π,并且内切与边长为2的正方形,用随机数,10000个点往下面投,落到圆里面的概率乘以4就是π的值 说明:等式左边,是圆与正方形面...

2019-07-14 22:28:04

阅读数 26

评论数 0

机器学习快速入门之线性回归

感谢Google开放这种机器学习资源。 本文一些术语 标签 标签是我们要预测的事物,即简单线性回归中的 y 变量。标签可以是小麦未来的价格、图片中显示的动物品种、音频剪辑的含义或任何事物。 特征 特征是输入变量,即简单线性回归中的 x 变量。简单的机器学习项目可能会使用单个特征,而比较复...

2019-06-22 21:02:49

阅读数 36

评论数 0

hive1.2.1整合hbase遇到的坑

通常我们会整合hive与hbase,通过创建hive外部表,进行一些增删改查hbase表,hive1.2.1整合hbase1.2.6,遇到了一些坑,通过修改了几行hive源代码,编译hive-hbase-handler.jar包解决了这个问题。 下载hive源代码:http://archive....

2019-06-20 23:18:43

阅读数 736

评论数 0

第一次赚钱经历,大三时录制在线课程,每月收入3千,生活费是够了?

这里,分享一个自己第一次的赚钱案例! 记得大三时候出去实习,我们数学院是在武汉的一个培训机构学习一个月,主要是学Python及大数据基础。说是实习,其实是没有工资的,毕竟是别人给我们上课,怎么还会给我们发工资! 我爱学习,晚上回来便会看腾讯课堂的Python课程直播,重要免费!顺便说一下,腾讯课堂...

2019-04-17 23:09:01

阅读数 1086

评论数 0

使用scala编写flink消费kafka实时计算pv,uv

实时统计pv、uv是再常见不过的大数据统计需求了,前面出过一篇SparkStreaming实时统计pv,uv的案例,这里用flink实时计算pv,uv。 我们需要统计不同数据类型每天的pv,uv情况,并且有如下要求. 每秒钟要输出最新的统计结果 程序永远跑着不会停,所以要定期清理内存里的过时数据...

2019-03-21 22:16:37

阅读数 1247

评论数 7

maprecue将两类ip分类去重并且输出到不同目录文件中

有一份含有两类ip的数据,根据一个字段标记来区分,现在需要将去重,两类Ip分类保存到不同文件中,第三类数据舍弃。mapreduce程序如下: pom文件 <?xml version=&...

2019-03-15 23:59:11

阅读数 151

评论数 0

redis 删除大key集合的方法

redis大key,这里指的是大的集合数据类型,如(set/hash/list/sorted set),一个key包含很多元素。由于redis是单线程,在删除大key(千万级别的set集合)的时候,或者清理过期大key数据时,主线程忙于删除这个大key,会导致redis阻塞、崩溃,应用程序异常的情...

2019-03-14 20:29:12

阅读数 1421

评论数 0

Python科学计算:matplotlib

原文链接:https://wklchris.github.io/Py3-matplotlib.html 本文介绍 matplotlib 相关的内容,以例子为主。 全文的初始化加载如下: import os import numpy as np import pandas as pd imp...

2019-03-13 20:46:03

阅读数 167

评论数 0

Python语法速查

原文链接:https://wklchris.github.io/Py3-basic.html 本文简要记录了 Python 3 的语法。 介绍 Python 是一门独特的语言,快速浏览一下他的要点: 面向对象:每一个变量都是一个类,有其自己的属性(attribute)与方法(method)...

2019-03-13 20:42:45

阅读数 193

评论数 0

kafka消息顺序与重复

kafka消息顺序 我们知道,kafka是一个高性能、分布式容错的消息发布-订阅系统,现在kafka也能处理流数据了。多个生产者在往kafka发送数据的时候,消息的顺序是不能保障的,也就是无序的。 有些场景,比如在用maxwell解析mysql的binlog日志的时候,发送到kafka,后面解...

2019-03-12 21:57:59

阅读数 652

评论数 0

Spark-Submit 常用参数用法

一个Spark任务好不容易开发完成了,终于要上集群跑了,就差万里长征的最后一步了:通过Spark-Submit命令上集群运行,这时候需要做哪些常规与优化工作呢。 这里贴一个常用的SparkSubmit提交脚本 脚本名称:submitHelperLabel.sh 脚本内容: spark-s...

2019-03-11 21:19:31

阅读数 159

评论数 0

Python系列之——好用的Python开发工具

工欲善其事必先利其器,一个好的工具能让起到事半功倍的效果,Python社区提供了足够多的优秀工具来帮助开发者更方便的实现某些想法,下面这几个工具给我的工作也带来了很多便利,推荐给追求美好事物的你。 Python Tutor Python Tutor 是由 Philip Guo 开发的一个免费教...

2019-03-10 23:17:03

阅读数 206

评论数 0

Flink 原理与实现:Aysnc I/O

背景 Async I/O 是阿里巴巴贡献给社区的一个呼声非常高的特性,于1.2版本引入。主要目的是为了解决与外部系统交互时网络延迟成为了系统瓶颈的问题。 流计算系统中经常需要与外部系统进行交互,比如需要查询外部数据库以关联上用户的额外信息。通常,我们的实现方式是向数据库发送用户a的查询请求...

2019-02-28 22:40:15

阅读数 128

评论数 1

Flink连接kafka,将DataStream转换为Table进行查询操作

Table API是用于流和批处理的统一关系API。 Table API查询可以在批量或流式输入上运行而无需修改。 Table API是SQL语言的超级集合,专门用于与Apache Flink一起使用。 Table API是Scala和Java语言集成API。 Table API查询不是像SQL一...

2019-02-22 23:31:11

阅读数 1801

评论数 0

Winwows下Python命令行执行脚本乱码

解决方法 1.直接使用 u’中文’ 形式,指明以unicode编码,解码方式会以顶部 #coding定义的编码方式,如果不写,以操作系统当前编码方法,建议写上#coding,因为要让操作系统编码和源文件编码经常会不一样。推荐使用这种方式 2.输出时指定解码方法 print ‘是’.decode...

2019-02-01 21:20:55

阅读数 125

评论数 0

提示
确定要删除当前文章?
取消 删除