【数据挖掘及分析】
杰瑞26
架构师、脚本语言专家;精通Python,Shell,正则表达式;熟悉Java, C, Tcl, Ruby, Scala, Perl等多种编程语言,在性能,开源,硬件及自动化测试方面也有非常丰富的经验
展开
-
XML 简介
XML 被设计用来传输和存储数据。HTML 被设计用来显示数据。应该掌握的基础知识:在您继续学习之前,需要对以下知识有基本的了解:HTML / XHTMLJavaScript如果您希望首先学习这些项目,请在我们的 首页 访问这些教程。什么是 XML?XML 指可扩展标记语言(EXtensible Markup Language)XML转载 2014-05-31 22:37:08 · 947 阅读 · 0 评论 -
Python来验证字符串是否代表一个合法的数字
经常会碰到的场景,从文件中读取的或用户输入获得的一个字符串,看是否是合法的数字格式。 可以有两个方案。方案一: 使用最简单的也是最Pythonic的"鸭子走路">>> def legal_numbers(s):... try:... float(s)... except ValueError:... return ...原创 2018-07-23 21:59:08 · 5447 阅读 · 0 评论 -
Shell中批量备份目录的一个小技巧
经常要备份备份某个目录下所有文件及子目录,有时候只需要备份某目录下的目录结构,这个可以可以使用一个小技巧,下面一条很小的脚本可以完成此功能,比如说,要备份/home/jerry目录到/home/tom家目录下,可以这样说明:find /home/jerry -type d -print | # 寻找所有/home/jerry目录下的所有子目原创 2017-07-24 20:53:01 · 1530 阅读 · 0 评论 -
Shell中整数自增的几种方式
在Shell脚本中,用于while或for循环中经常要涉及到整数自增的情况,下面罗列下可能的方式【方式一】declare -i来声明整数变量root@localhost:~# declare -i x=1root@localhost:~# x+=1root@localhost:~# echo $x2【方式二】使用let命令root@localhost:~# i=1root@l原创 2016-08-27 19:07:40 · 12937 阅读 · 0 评论 -
Ubuntu使用vdbench批量创建目录和文件
Vdbench 是一个命令行实用程序,旨在生成用于验证存储性能和存储数据完整性的磁盘 I/O 负载。还可通过输入文本文件指定 Vdbench 执行参数,下面是使用vdbench批量创建目录和文件的示例1. 先利用wget下载vdbench,比如当前版本为:vdbench503.zip2. 再使用unzip命令解压缩, $ unzip vdbench503.zip -d /data/原创 2016-05-03 22:31:05 · 4909 阅读 · 0 评论 -
scala学习初步
出于要处理进行大数据分析,听说scala就是做大数据分析和机器学习的,spark就是用scala开发的,百度上一输入scala后面就是大数据,一种基于JVM基础上开发的,一种类似于JAVA的编程语言,一种集合面向对象语言和函数式函数于一体的多范式编程语言。更有传言说,会成为下一代JAVA语言。更主要考虑自己要做大数据分析,OpenStack开源等方面的测试,必须对该门语言有比较深入的了解.原创 2016-05-01 10:27:49 · 831 阅读 · 0 评论 -
为什么有时候执行ls命令非常缓慢
在碰到系统资源紧张,海量文件的情况下,执行ls命令,特别是ls -laRt命令,会很慢,笔者就碰到在几百万~几千万个海量小文件的情况下,执行ls -laRt命令要花1分钟到数个小时的情况。这种情况因属正常,要解释为什么会这么慢,就必须先说明下Linux中的内部命令和外部命令【内部命令 VS 外部命令】内部命令:所谓内部命令是指写在bash源码里面的,其执行速度比外部命令快,因为解析原创 2016-04-30 11:16:36 · 14364 阅读 · 0 评论 -
Python代码优化概要
Python即是面向过程语言,也是面向对象语言,更多情况下充当脚本语言的角色。虽是脚本语言,但同样涉及到代码优化的问题,代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使程序运行效率更高,根据80/20原则,实现程序的重构、优化、扩展以及文档相关的事情通常需要消耗80%的工作量。优化通常包含两方面的内容:1. 减小代码的体积、提高代码的可读性及可维护性。2. 改进算法,降低代码复杂度,提高代码运行效率。选择合适的数据结构一个良好的算法能够对性能起到关键作用,因此性能改进的首要点是对算法的原创 2014-12-21 13:19:45 · 1800 阅读 · 0 评论 -
Python中用ElementTree解析XML
先介绍XML基本概念介绍再介绍XML几种解析方法最后介绍ElementTree解析具体如何使用原创 2015-02-25 14:49:18 · 8970 阅读 · 4 评论 -
Python对MySQL数据库的操作
Python中,可以使用MySQLdb模块连接到MySQL数据库,对MySQL数据库进行操作【第一步】: MySQL安装参考文档: http://blog.csdn.net/Jerry_1126/article/details/20837397 【第二步】: 连接到MySQL创建数据库Welcome to the MySQL monitor. Commands end原创 2015-02-22 11:44:56 · 2662 阅读 · 0 评论 -
Python中最大递归深度值探讨
Python对递归函数设置是有默认值。 可以通过下面命令来查看设置的默认值>>> import sys>>> sys.getrecursionlimit()3000查看该函数的帮助文件就更清晰了:>>> help(sys.getrecursionlimit)Help on built-in function getrecu...原创 2018-12-28 22:20:32 · 5714 阅读 · 0 评论