waylyw-CSDN博客

原创实现：crontab定时任务定时到秒

示例如下：每天12点30分运行程序30 12 * * * nohup /usr/bin/python-u /home/test.py >test.log2>&1 &如下: 每天12点30分30秒运行程序30 12 * * * sleep 30;nohup /usr/bin/python-u /home/test.py >test.log2>&1 &...

2021-09-26 17:57:34 766 2

背景某不知名小券商，集群设置的定时任务总是在非交易日运行，定位到是集群时间不一致导致于是着手对公司三套CDH集群(测试、仿真、生产)的时间进行同步设置搜索参考了很多时间同步相关的博客，主要是使用ntp时间同步软件进行，这里不在多说，下面介绍一种较为简单粗暴的方式解决过程：1、角色说明服务器 A：可用来同步时间的时间服务器，即它的时间是准确的服务器B：CDH集群中充当时间服务器节点，因为B要同步A的时间服务器其他节点：即CDH集群中除B之外的所有节点2、具体过程确保1中

2021-09-26 17:46:18 860

原创实现：linux访问windows共享文件夹

背景确保在linux能访问windows机器网络联通在Linux机器上执行 telnet IP 445 测试是否联通如：telnet10.0.22.15 4451、进入linux机器 /dev 目录创建目录cd /devmkdir /mnt/testdir2、进入到创建的目录cd /mnt/testdir3、执行下行命令mount -o username=yonghu,password=mima //10.0.22.15/dir1/dir2 /mnt/tes..

2021-09-18 10:32:28 2696

原创干货“python基础之元组与集合“

今日分享：python基础之元组与集合相对于前面介绍的几种数据类型，元组、集合的内容相对较少，所以就放在一块来介绍：元组元组（tuple）是由任意类型元素组成的序列，这一点和列表类似，但不同点在于元组是不可变的。元组的创建是使用 () 来创建的，()空元组是最简单的元组，当创建包含一个或多个元组时，每一个元素后面都需要跟上一个逗号，其实在创建非空元组时，是不需要括号的，但是网上的很多资料教程中都默认在创建元组时直接输入括号，然后在括号中添加元素，下面的例子可以看到>>&

2021-08-29 20:45:26 235

原创干货“python基础之字典“

# 数据分析必须对时间敏感，交易要关注成功还是失败# 业务知识积累## 名词解释#### 1.双融交易股票前有个融字是指这个股票可以融资、融券。融资的意思就是指投资者可以向证券公司交一些保证金，然后借钱买入股票，并在约定的期限内偿还借款本金和利息；融券的意思就是投资者用资金或者证券作为抵押，向证券公司借证券卖出去，并且在约定的期限内，买进相同的品种和相等数量的证券还给证券公司并且支付相应的费用。#### 2.持仓持仓是一个期货术语。持仓的意思就是通过买入的办法持有一定数量期货合约。具

2021-08-29 20:38:25 313

原创已解决：sqoop mysql导入hive报错

报错内容：ERROR hive.HiveConfig: Could not load org.apache.hadoop.hive.conf.HiveConf. Make sure HIVE_CONF_DIR is set correctly.

2021-05-30 11:40:17 827

原创 maven添加依赖无法加载报错main java.lang.NoClassDefFoundError

背景：spark-sql开发时，在pom.xml文件添加如下依赖<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2.11</artifactId> <version>2.1.1</version> <scope>provided</scope></dependen.

2021-05-27 11:28:22 291

原创 linux安装pip3

系统：Ubuntu版linux安装python3环境下的pip3命令apt-get install python3-pip或sudo apt-get install python3-pip

2021-05-26 09:42:17 7984 1

原创 kafka集群开启后自动挂掉

问题：开启kafka集群后，大概不到一分钟后便挂掉个人解决方法：1、开启zookeeper集群后，删除已经创建的kafka节点尤其是brokers节点目录2、勿忘修改kafka集群节点的每个id

2021-04-23 17:13:37 832

原创解决：hdfs网页界面创建文件夹权限问题

错误：通过hdfs网页端创建文件夹时报如下错误Permission denied: user=dr.who, access=WRITE, inode="/":root:supergroup:drwx解决方法：执行该命令：hadoop fs -chmod -R 777 /根目录/下全部赋予读写执行权限777

2021-04-22 11:14:50 1294

原创 IDEA 向上或向下新增一行，并光标移入

IDEA开发工具快捷键：向上新增一行，并光标自动移入该行：Ctrl Alt Enter向下新增一行，并光标自动移入该行：Shift Enter

2021-04-11 14:21:32 2590 2

原创 linux下使用find命令查找特定文件

1、默认在当前目录下查找： find -name test.py find为命令，-name表示根据文件名，test.py则为要查找的文件执行返回文件的绝对路径，若无该文件，则什么也不返回2、在指定文件夹下查找 find /home -name test.py 上述则表明在home目录下，根据文件名来查找test.py文件...

2021-04-08 10:25:19 1071

原创 python基础之列表

今日分享：pytohn基础之列表定义及创建列表是一种序列结构，可以包含多个元素，不要求每个元素的类型一样，可以有数字，字符串等。列表通常是以 [] 来表示的>>> list_1 = [1,2,'hello',[],{'key':'value'},{1,2,3},(1,2,)]>>> type(list_1)<class 'list'>这样一个列表就创建成功了，可以看到列表中的元素类型包括：数字、字符串、空值列表以及后面将.

2021-03-21 21:49:06 308

原创已解决：Eclipse添加第三方jar包到动态web工程

问题：如何添加第三方jar包到java web工程开发工具：Eclipse解决：1、当我们通过 File >>> new >>> Dynamic web project一个动态工程后2、其下会有一个如下图所示的lib文件夹3、将所需要添加的jar包复制到文件夹即可...

2021-03-21 11:56:44 374

原创 python之数字

今日分享：python基础之数字理解数字在python中，数字是一种常见的数据类型，又细分为整型和浮点型数字，即整数和浮点数。整数很好理解，比如常见的1、2等，对于浮点数，普遍说法是带有小数点的数，比如3.14，而百科是这样解释的：浮点数是属于有理数中某特定子集的数的数字表示，在计算机中用以近似表示任意某个实数。具体的说，这个实数由一个整数或定点数（即尾数）乘以某个基数（计算机中通常是2）的整数次幂得到，这种表示方法类似于基数为10的科学计数法。对于大家来说，可以直接将其理解为小数。简单运算

2021-03-19 07:25:35 1375

原创 eclipse开发工具下 java创建mysql数据库properties配置文件存放路径

开发工具：eclipse解决问题：数据库properties文件存放路径背景介绍：在使用阿里的Druid德鲁伊数据库连接池工具时，代码中需要加载读取properties文件，翻了很久博客，总算找到了一个靠谱的解决方案具体步骤如下：鼠标右键点击项目名称，创建源码包：new -> Source Folder名称设为config，然后将配置文件放在该文件夹下mysql配置文件代码如下：url=jdbc:mysql://105.105.139.202:3306/test?re

2021-03-17 11:00:01 3830

原创 Java连接MySQL 实现数据的增删改查附实际代码

环境介绍：编辑器：Eclipsemysql数据库jar包：mysql-connector-java-8.0.22.jarjava版本：1.8*eclipse如何加载jar包，可参考https://jingyan.baidu.com/article/f3e34a127f837db5eb6535d3.html这里不做重点分享主要内容：主方法代码如下所示： public static void main(String[] args) { // 声明Connection对象..

2021-03-15 16:12:43 1202

原创 flume实战：监控文件所追加内容

一：agent配置文件内容# 声明agenta1.sources = r1a1.sinks = k1a1.channels = c1# 监控test.log文件追加内容a1.sources.r1.type = execa1.sources.r1.command = tail -f /opt/software/flume/datas/test.log# Describe the sinka1.sinks.k1.type = logger# Use a channel which

2021-03-13 14:04:06 324

原创 flume实战：netcat端口数据监听

一：环境说明jdk版本：jdk-8u171-linux-x64.tar.gzflume版本：apache-flume-1.7.0-bin.tar.gz需要的小伙伴请自行下载解压并配置，这里不再阐述，若有问题，请评论或移步到公号留言二：实战示例1、编写配置文件此处可先在flume安装目录下创建job文件夹，后续编辑的agent配置文件可放在该文件夹下，(文件夹及文件名自定义即可，保持一致)# 声明一个agent：a1，并分别指定其三大组件的名字a1.sources = r1a

2021-03-13 11:57:39 1108 1

原创 django js代码实现点分IP与整型数值的互相转换

问题发现：通过js代码向django路由URL传参时，发现路由未能正确解析获取点分IP的值解决：对点分IP进行js转换，将整型数值传参到djangoURL中即可下述是点分IP与整形数值之间的互相转换函数：// 将点分ip转换为整型数值function ipToInt(ip){ let num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256.

2021-03-11 10:46:07 140

原创 python之字符串

今日分享：python之字符串一：定义及创建字符串就是一系列字符，它是一种数据类型。创建时通常利用引号来括起，单引号或者双引号都可以，但必须是同类型、成对出现。>>> message = 'hello world'>>> message'hello world'>>> message = "hello world">>> message'hello world'二：字符串的家长里短..

2021-02-22 07:18:41 186 2

原创 mysql数据表文件备份及恢复

以下介绍如何将特定mysql数据库中的表备份到本地.sql文件，在此过程中直接对源表进行压缩备份，减少存储空间占用备份：mysqldump -h 192.168.1.32 -P3306-uroot-pway123testdb test | gzip > test.sql.gz恢复gunzip < test.sql.gz | mysql -uroot -pway123 -h 192.168.1.32 -P3306testdb如上命令中可变参数为：数据库表所在IP...

2021-02-02 15:25:39 370

原创 Django中将已存在的数据表生成对应的models模型层文件

问题：如何将mysql中已存在的数据表生成Django框架中models.py文件中的模型层代码下面仅介绍个人在解决该问题中的拙见：主要依靠该命令：pythonmanage.py inspectdb >应用名称/models.py在使用该命令时需注意以下几点：1、大坑：如果已建立Django工程及应用，并已经通过迁移命令生成一些内置表，如果此时将外部的表复制到该项目数据库中，再使用上述命令，那么在此过程中很有可能报错，并导致models.py文件中已存在的模型层代码清空（慎用，一旦..

2021-01-28 09:09:32 413

原创实现Django后端获取前端下拉框内的值

实现：通过在前端HTML页面的下拉框选择内容，实现后端view视图层获取到该内容值1、前端HTML代码如下：通过在一个表单中内嵌一个下拉框注意该form表单的提交方式为method="post"内嵌select选择框，千万要注意不能都是lable标签，否则将会返回None值，不能达到目的<form action="result.html" method="post" name="tasksubmit"> {% csrf_token %} &l

2021-01-20 15:46:45 4112

原创 spark log4j.properties配置文件输出日志级别修改

开发工具：IDEA开发环境：win10本地环境，spark运行spark程序时，控制台总会输出很多红色日志，默认日志输出级别为INFO，可通过以下两种方法进行日志级别的修改方法一：在代码块中进行日志级别的设置 val sc = SparkSession.builder() .config("spark.testing.memory","2000000000") .master("local[*]") .appName("aiwen.com")

2021-01-16 15:38:26 1088

原创已解决：python3高版本lxml模块无法导入etree

可通过安装低版本lxml解决pip install lxml==4.1.0 （python3环境）

2021-01-05 15:09:47 2832 4

原创已解决：pyspark调用mysql 报错 java.sql.SQLException: No suitable driver

centos-python3环境下，调用pyspark库连接mysql数据库时报错：java.sql.SQLException: No suitable driver具体如下： File "/usr/local/lib/python3.6/site-packages/pyspark/sql/readwriter.py", line 155, in load return self._df(self._jreader.load()) File "/usr/local/lib/pytho

2020-12-17 16:06:02 1877 1

原创已解决：Exception: Python in worker has different version 2.7 than that in driver 3.6

已解决：Exception: Python in worker has different version 2.7 than that in driver 3.6, PySpark cannot run with different minor versions.Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set.在阿里云服务器上运行pyspark模块程序时，核心报错如

2020-12-17 15:51:40 5882 1

1500种疾病及病症数据.xlsx

空空如也