windows系统下安装kellte及连接mysql服务器 Kettle简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle是“Kettle E.T.T.L. Envirnonment“只取首字母的缩写,这意味着它被设计用来帮助你实现你的 ETTL 需要:抽取、转换、装入和加载数据;翻译成中文名称应该叫水壶,名字的起源是开发者希望把各种数据放到一个壶里然后以一种指定的格式流出。Spoon 是一个图形用户界面,它允许你运行转换或者任务,其中转换是用 Pan 工具来运行,任务是用
记录自建ALIDDNS服务域名解析和外网访问 本文参考https://blog.csdn.net/y1534414425/article/details/90699532除上文外要补充的有AccessKey ID和AccessKey Secret可以使用子账号只需要添加一个AliyunECSReadOnlyAccess权限就可以了需要路由器上虚拟机服务设计端口映射完事就可外网访问了...
superset在linux和windows下的安装和部署 前言Superset 是 Airbnb开源的数据探查与可视化平台,是个轻量级的BI工具,开发者可以在其开源代码上根据需要进行二次开发。最近在探索数据分析平台的应用,就来试一试,然而superset更新迭代的速度太快,里面也有太多的坑,花了两天的时间踩完,下面就把流程以及相应的坑分享~superset github地址:https://github.com/apache/incubator-superset官方文档:http://superset.apache.org/installation.html
天天基金爬虫 import requestsfrom requests.exceptions import ConnectionErrorfrom pyquery import PyQuery as pqimport operatorfrom functools import reduceimport reimport jsonimport pandas as pdimport numpy as npheaders = { 'Host':'club.jd.com', '
python按时间坐标预测销量 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplimport datetimeimport warningswarnings.filterwarnings("ignore")import statsmodels.api as smfrom statsmodels.graphics.api import qqplotfrom statsmodels.ts
ubuntu安装记录 记录安装ubuntu系统的mysql和samba共享服务的坑1.安装mysql8.0的话,需要先安装一个mysql-apt-config_0.8.15-1_all.deb的文件,dpkg -i mysql-apt-config_0.8.15-1_all.deb2.然后sudo apt install mysql-server3.按部就班的安装,MySQL8.0采用了新的加密方式,一定要注意,正是因为这个加密方式才导致Ubuntu18.04用设置的root密码登录不了MySQL,因为Ubuntu18.0
算年化利率的公式 def ap(p,n,r): i = 0 l = 0 s = 0 while i <= n: l = (s+p-i*p/n)*(r/12) i += 1 s += l return s #ap(3999,24,0.04)import matplotlib.pyplot as pltimp...
报错:(1193, "Unknown system variable 'tx_isolation'") pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade sqlalchemy --ignore-installed这个安装以后会报错提示如下WARNING: You are using pip version 19.3.1; however, version 20.0.2 is available.You sho...
Panda read_csv() 在anaconda中读入中文列时显示为乱码的问题 一开始怎么搞都没有用df0 = pd.read_csv(p1,,encoding='utf-8)报错df0 = pd.read_csv(p1,engine='python')打开全是乱码df0 = pd.read_csv(open(p1))依旧打不开df0 = pd.read_csv(test_data_file_dir,engine='python',sep=',',enco...
python操作Excel实用技巧 1.使用“|””对字符串进行分隔,然后可以筛选出保函有的品类m = "|".join(list(pbpd['品牌信息']))uhpb['种类'] = uhpb['商品信息'].str.findall(m)2.多张Excel合成为一张,并加入A列以区分dfs = []p = os.listdir(r'D:\xml\............')for i in range(len(p)...
数据归一化处理方法 最值归一化 Normalization# 最值归一化 Normalizationimport numpy as npx = np.random.randint(1,100,size=100)#进行最值归一化x = (x - np.min(x)) / (np.max(x) - np.min(x))#多维数组的最值归一化X = np.random.randint(1,100,(50,...
K近邻算法--鸢尾花数据集 from sklearn import datasetsiris = datasets.load_iris()x = iris.datay = iris.targetfrom sklearn.model_selection import train_test_splitx_train, x_test,y_train, y_test = train_test_split(x,y,te...
selenium爬虫丁香医生实时播报 from pyecharts.faker import Fakerfrom pyecharts import options as optsfrom pyecharts.charts import Mapfrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdri...
实时的可视化疫情地图 多难兴邦,希望疫情尽快结束,等待春暖花开from pyecharts.faker import Fakerfrom pyecharts import options as optsfrom pyecharts.charts import Mapfrom selenium import webdriverfrom selenium.webdriver.common.by import By...
pandas生意参谋数据处理 import os import pandas as pdhhye = os.listdir(r'C:\Users\18352\Desktop\Python\read_Excel\01-天猫行业数据分析')for k in range(len(hhye)): wwdu = os.listdir(r'C:\Users\18352\Desktop\Python\read_Excel...
简单层的实现 class MulLayer: def __init__(self): self.x = None self.y = None def forward(self,x,y): self.x = x self.y = y out = x*y return out ...
天猫超市requests爬虫 import pymongoimport requestsfrom requests.exceptions import ConnectionErrorfrom pyquery import PyQuery as pqimport timeclient = pymongo.MongoClient('localhost')db = client['tmmc']#PROXY_POOL...