自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (3)
  • 收藏
  • 关注

原创 Kettle的增量抽取以及定时抽取转换更新数据入门教程

  在实际项目中往往需要使用定时更新数据,当Kettle的转换比较多的时候,手动一个个执行转换有点不太现实,今天就分享怎么完成定时更新数据。如果其中有些步骤看不懂的话可以看我Kettle分类下的另一篇文章增量更新包括三个组件(我拿之前做好的来示范,刚添加完三个组件之后,组件之间的连接线都是只有一个箭头,当完成表输入2的配置之后,表输入到表输入2的连接线就会变成这张图一样)先配置第一个表输入,第一个表输入的数据库连接为ODS层所在的数据库select max(ts) ts from ods层的表名

2021-09-16 11:41:30 7836 2

原创 Kettle的全量抽取新手教学(源数据->ODS层)

Kettle的全量抽取新手教学(源数据->ODS层)   这次操作的数仓分为ODS层和DW两层,ODS层用O_表名来命名,DW层用D_模块名_表名命名。一般情况下都是在服务器下完成Kettle的操作,今天只分享在本地环境下的操作。服务器上的操作只需登录Kettle账号,配上服务器地址即可。(本文使用的是Oracle数据库,和MySQL数据库略微不同)源数据->ODS层本地安装好Kettle之后,打开安装目录,双击运行Spoon.bat;打开速度稍微有点慢新建一个转换,直接双击转换或者点

2021-09-16 10:43:00 5215

原创 爬取贝壳网深圳二手房实战

       完整走一遍从数据爬取下来到完成数据预测的流程,这次先把爬取数据整出来。爬取的内容是深圳龙岗区的二手房数据,一共有3000条。- 先把要用的包导进来import reimport xlwtimport requestsimport collectionsfrom bs4 import BeautifulSoup- 解析网站       由于

2020-12-24 11:44:28 1352 1

原创 Access denied for user ‘root‘@‘localhost‘ (using password: YES) mysql8连接失败

      自己电脑装了两个mysql版本,一个5.7一个8.0。今天再次想再连接mysql发现连接不了。      通过快捷键win+R进入运行窗口输入services.msc,在弹出的窗口中发现mysql正在运行,点击停止掉。    停止完之后重新启动服务发现,还是不能启动mysql。     突然忘了意见很重要的事情,那就是cmd窗口是在

2020-12-13 23:17:07 206

原创 windows命令行窗口执行hadoop version 提示‘hadoop‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件。

       在windows命令行窗口环境下执行hadoop version一直提示"hadoop不是内部或外部命令,也不是可运行的程序 或批处理文件。"       网上搜的配置系统变量也配了,什么注意空格分号的也注意了,winutils要对应hadoop版本也检查了。但一执行hadoop version就提示"hadoop不是内部或外部命令,也不是可运行的程序

2020-11-20 12:26:35 12305 6

转载 hadoop运行jar包处理文件一直处于Running job状态的解决方法

参考博客:https://blog.csdn.net/dai451954706/article/details/50464036起初一直以为是导出的jar包有问题,百度了很久也没找到解决办法,最后终于让我找到了有用的解决办法。在 yarn-site.xml中添加<property> <name>yarn.nodemanager.resource.memory-mb</name> <value>20480</value>&l

2020-10-30 11:44:59 1356 3

原创 虚拟机ping不通主机,而主机能ping通虚拟机的解决方法

  安装好虚拟机之后配置网络,配置完之后发现虚拟机并不能ping通主机,但是主机却能ping通虚拟机。(虚拟机设置为桥接网络)  突然想到是不是防火墙没关的问题。果然,主机的防火墙一关我就能ping通了(虚拟机的防火墙也已经关闭)。但问题也来了,防火墙不可能一直关着吧。想到了Redis的防火墙策略,就自己试了试,没想到真可以。1.先打开防火墙的高级设置2.打开入站规则找到配置文件为专用,公用的文件和打印共享3.右键启用规则4.进入虚拟机重置网络,尝试ping通主机...

2020-10-02 19:13:07 2262

原创 修改Redis端口号以及解决修改完端口号但是没有生效的问题

Redis默认端口号是6379,如果不把端口号修改的话,可能会受到攻击。当然,如果改的端口号太简单的话也会受到攻击。找到Redis的安装路径,用编辑器(我用的是Notepad++)打开redis.windows.conf。 切记不要用记事本打开这个文件,因为这样会导致文件编码格式出问题,如果已经用记事本打开的话,此处建议重新安装Redis。找到port之后修改端口号并保存。用命令窗口启动Redis,这里要注意的就是除了要输入redis-server.exe之外,还需要输入配置文件的文件名redi

2020-09-18 21:49:30 4411

原创 当他人连接不到自己电脑的Redis时的解决方法以及新建连接的注意事项

1. 启动关闭Redis打开命令窗口,输入Redis的安装路径,找到redis-server.exe。按Ctrl+c可退出Redis或在任务管理器中根据PID号结束进程,根据PID来关闭进程是因为可能会遇到有多个Redis进程,只能根据PID来精确找到Redis结束进程。2.Redis管理器的简单使用打开Redis管理器,测试完连接之后点击好完成连接如果出现对方输入本机IP出现连接不上的情况,可关闭本机的防火墙。3.Redis的添加主键命名方式如果分号为中文符的话,会出

2020-09-12 09:50:18 824

原创 Python爬取豆瓣Top250数据小项目完整源码

导入相关的包from bs4 import BeautifulSoupfrom urllib.request import urlopenimport urllibimport lxmlimport reimport random需要改掉文件路径def get_html(): base_url = "https://baike.baidu.com" his = ["/item/%E8%BD%A6%E8%BD%AE/1468488"] for i i.

2020-09-10 12:26:17 255

原创 Python数据挖掘处理通话数据、短信以及上网记录完整项目+源码+源码解释

对通话、短信以及上网记录的数据来预测风险用户本文代码全部采用jupyter运行先导入相关的包# -*- coding: UTF-8 -*-import pandas as pdimport numpy as npfrom xgboost import XGBClassifierfrom sklearn.ensemble import RandomForestClassifierfrom sklearn import metrics, model_selectionfrom sklearn.

2020-09-10 11:13:11 1712 3

原创 解决CentOS7ping不通百度以及连接Xshell,winscp的方法

困扰好久的问题在大神的指导下终于被解决了,之前一直尝试修改都不行,今天来缕一缕思路,做个记录。

2020-09-09 21:22:06 704 1

原创 XAMPP详细安装教程

安装XAMPP教程打开XAMPP安装包等待安装完成打开安装好的XAMPP出现这种问题之后,我直接采用修改Apache端口号的方法修改完Apache之后点击start运行MySQL,结果一直没开启成功,一直显示框框中的语句。百度几篇文章的结果就是找到regedit.exe修改注册表里mysql的路径。打开C盘搜索regedit.exe我这修改之前的路径是:“C:\Program Files (x86)\MySQL\MySQL Server 5.

2020-09-09 11:07:55 1160

winutils-master压缩包

该压缩包里包含对应着十几个hadoop版本,但没适配2020年hadoop最新的几个版本。。。。。。

2020-11-20

数据挖掘分析数据包.zip

十几万条电话、短信、网络以及app数据资源集合。配合"Python数据挖掘处理完整项目及详细解释"这篇博客使用。

2020-09-10

winscp+Xshell6.zip

针对自学Centos7的用户提供便捷服务,该软件方便CentOS7与本机直接相互传输文件,我也写了一篇博客可配合使用(博客只写了两个软件怎么和CentOS7连接,具体怎么上传文件需自行百度)。

2020-09-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除