- 博客(15)
- 资源 (3)
- 收藏
- 关注
原创 hbase2.2.2在伪分布系统中的安装部署
我用的hbase是2.2.2版的,下载地址可以从我的网盘中下载。提取码:rnfk不同版本的hbase对hadoop环境的要求版本也不同,如我用的hbase2.2.2就要求hadoop版本不低于3.1.3,安装时需要注意一下。关于hadopp3.1.3伪分布系统的安装配置见前段时间的文章。
2024-09-30 21:03:43 1044
原创 ubuntu下部署hadoop3.1.3伪分布系统
Hadoop是apache开发的,分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架。其核心部件是HDFS与MapReduce。HDFS是一个分布式文件系统,MapReduce是一个分布式计算框架。说通俗点,HDFS像是一个可以动态扩展的用来存储大规模数据的大硬盘,MapReduce像是一个计算引擎,通过规则编写程序,用于完成指定的计算任务。【所需软件】以上两个资源以及后面要用到的hbase,可从我的迅雷网盘中下载:rnfk。
2024-09-13 09:58:29 1429
原创 Oracle VM VirtualBox 虚拟机安装Ubuntu并实现主机与虚拟机的数据共享
Oracle 公司的VM VirtualBox是一款不错的虚拟机软件。免费、开源,利用这个软件,可以实现电脑在一台计算机上,模拟多个独立、不同类型的虚拟操作系统。这一段时间一直在学习大数据方面的知识,其中涉及的hadoop,hbase及其它相关软件都需要在linux下运行,而我的电脑工作、学习都习惯于window平台,这样在VM VirtualBox虚拟机下安装ubuntu的情况下,就能兼顾了。
2024-09-11 14:18:25 1774
原创 python利用jieba组件成批对文件形成主题词文本
因为文件比较多,手工输入主题词工作量比较大,利用python的jieba组件,可以方便的把文件名字符串转化为主题词,然后直接成批复制粘贴到数据库就可以了。如加上关键字参组,cut_all=False(默认为True),则为全模式,返回所有可能构成词组的列表。代码运行后,会在文件夹下多一个keyword.txt文件,打开后可以看到:每个文件的主题词已经形成,全选复制,粘贴到数据库中就可以了。代码不多,也都有注释,主要是对指定文件夹中的每个文件名进行分析、形成关键字列表,再用|符号组合到一起,放入文件文件。
2024-07-22 15:24:02 398
原创 使用Python从excel中抽取数据并生成工资台账
对年中离职的员工,其工资也只统计到其离职的一月,对于年中新入职的员工,其工资也只从入职时显示,避免的从excel表手工复制、粘贴的错误发生。而在实际工作中,工资表是每月生成的,即每月的工资都在一个单独的excel表中,每个员工的工资放在1-12月的12个月excel文件中。其中利用VBA,也可以实现对上述功能的实现,有兴趣的朋友也可以在excel表中添加宏,用VBA来实现数据汇总的功能,原理上是一样的。3、在每个工作捕中,根据员工的工号,提取姓名和当月应发工资(计算社保是以应发工资为基准的)
2024-07-10 14:04:10 452 3
原创 Python使用EasyOCR做一个对多图的连续扫描识别的OCR工具
工作中,我们经常需要对一些图片进行扫描识别,用于将图片中的文字转化为txt文本,再进行编辑处理。而通过Python简单的开发,就能实现OCR(即光学图像识别)的功能。
2024-06-25 14:17:05 864
原创 用海纳思做web服务器并进行内网透传的实例
这个机子用了大约十几天,总结一下,好处:1、轻巧便捷:大小和路由器差不多,在弱电箱里接上电源和网线就不管了;2、节能省电,12v1A的电源,全年24小时不停机的电费也不会超过100元;3、安静,这个小家伙只没有风扇,靠自己铝合金外壳被动散热;4、便宜:这是也是最重要的。因为玩客云经营商已经停止服务,这个废品之样的东东在网上只卖几十块钱,加上cpolar的二级域名,也不过是一百多块钱,就有了一台自己的web服务器。
2024-05-01 01:29:41 4097 4
原创 用python的PILLOW做一个多图合并PDF的工具
实际工作中,经常需要对大量的图片合并为一个PDF文件,以便文件的传输和保存。网上有许多图片生成PDF的工具。其实利用Python的Pillow组件,我们也可以用pyqt5制作一个有模有样的PDF生成工具。
2023-12-16 14:43:33 1381 1
原创 Python 通过pymssql访问查询操作 SQL Server数据库
使用pyton(pyqt5)通过pymsslq访问SQL Server的实际模型
2023-07-04 15:32:49 6598
原创 利用python的pillow组件开发一个图片批处理工具
提供了强大的图像处理功能,包括改变图像大小,旋转图像,图像格式转换,色场空间转换,图像增强,直方图处理,插值和滤波等等。图片绽放的方式有三种,一是按指定比例缩放,二是按指定宽度缩放(根据原始图片自动计算高度),三是按指定高度计算(根据原始图片自动计算宽度),在选择某一个缩放方式后,只让对应的控件可用,其它两个不可用。因图片的处理耗时比较长,为了能在多行文本框中及时反馈处理进度和处理信息,我们在新线程中进行图片处理,根据处理进度,不断向主线程反馈,并在多行文本框中显示处理进程,如下图。
2023-06-19 15:51:12 375
原创 Pyqt5实现新线程更新窗口UI
我们用pyqt5开发窗口应用时,应用会执行一些耗时的操作,如复制大量文件,下载大量数据等。一般情况下,在这些操作没有完成时,窗口的UI处于“假死”状态,不会更新,只有所有操作完成后,窗口的状态才会更新。这样对用户使用非常不友好。使用多线程技术,在新线程内进行那些耗时的操作,同时根据操作进度向主线程返回操作进度,根据进度更新窗口UI,可以实现更好的用户体验。下面是用一个简单的例子说明实现过程。
2023-06-11 13:23:34 3901
原创 小白学习在Deepin下配置python+pycharm+pyqt5开发环境
小白学习在deepin下配置python+pycharm+pyqt5开发环境
2023-03-27 22:46:07 1320
原创 用WS2812做一个自行车转向尾灯
用WS2812做一个自行车转向尾灯这段时间锻炼的少了,血糖又有上升的趋势,就把我的破自行车修了一下,开始骑行。但夜间骑行不安全,就考虑加一个尾灯。把零件盒里的电子垃圾扒拉了一下,找到一块ws2812b,8联封装好的那种,一块以前买的的arduino nano,再从老婆的旧电动车上拆了一个转向开关总成,然后就开始组装了。【实现功能】我要实现的功能很简单,从车把上控制尾灯的开关及左转右转。正常情况下,尾灯以呼吸灯的形式提醒后车,转向的时间采用向左或向右的流水灯显示。【所需配件】1、Arduino n
2021-12-30 22:49:57 4509
原创 用四位数码管和DS3231时钟模块做车载电子时钟
用四位数码管和DS3231时钟模块做车载电子时钟本来咱车上收音模块上是有一个时钟的,但换了导航以后,发现时钟不好用了:主界面上有时钟,但位置太靠左侧,俺的大手握方向盘刚好挡住视线,而且在播放音乐时,时钟就移到了右上边的一行小字,看起来非常吃力。没关系,找出咱们aruino套装,买的时候商家送了一些小零碎,找出来自己做一个车载时钟。一、需要的零部件:1、一块arduino nano单片机。...
2019-12-17 10:50:46 2024
用python开发一个多图片合并一个PDF文件的小工具及python源码
2023-12-16
一个使用python开发的图片批处理工作,包括python源码和生成的exe文件
2023-06-19
DS3231.rar
2019-12-17
四位数码管+DS3231做电子时钟源码.ino
2019-12-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人