python数据人工智能
AnalogElectronic
这个作者很懒,什么都没留下…
展开
-
mysql分区与不分区、InnoDB和MyISAM引擎比较实验
结果说明,分区确实可以改善查询效率。原创 2023-05-12 16:56:11 · 180 阅读 · 1 评论 -
windows上datax的使用记录
datax使记录简介DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS 等各种异构数据源之间高效的数据同步功能。1、下载datax2、下载python2.7安装之后设置环境变量。原创 2022-12-22 11:14:38 · 1594 阅读 · 0 评论 -
python实现画板功能并操作数据库
'''实现简单画板功能并存储线段信息'''import sysimport timeimport pymysql.cursorsfrom PyQt5.QtWidgets import (QApplication, QWidget)from PyQt5.QtGui import (QPainter, QPen)from PyQt5.QtCore import Qtconnect = pymysql.Connect( host='localhost', port=3306,原创 2021-12-30 20:47:04 · 1052 阅读 · 0 评论 -
kettle使用经验02
作业里的步骤是顺序执行的,转换里的步骤是并发执行的。所以不需要在作业里面加入等待组件。如下具体如下原创 2021-11-09 11:25:16 · 661 阅读 · 0 评论 -
理想条件下计算愚公移山需要多久
理想条件下计算愚公移山需要多少时间。太行山看成是一个底面是椭圆的椎体,长半轴a=400,000米,短半轴b=3000米,海拔3000米。太行山距离渤海200,000米,每个人每天移动15kg(一个星期两个人用辆车移动210kg,去4天,回来3天)。假设愚公有3个儿子,每个儿子都娶媳妇了,三十年算一代,每一代都生2个儿子。每一代活80岁,60岁退休。每一代当中,一半的人负责从事生产活动,一半的人负责搬山。package test.algorithmQuestion;import java.uti原创 2021-01-30 18:36:14 · 2566 阅读 · 0 评论 -
sql查询练习题的参考答案
-- mysql练习CREATE TABLE Student( s_id VARCHAR(20), s_name VARCHAR(20) NOT NULL DEFAULT '', s_birth VARCHAR(20) NOT NULL DEFAULT '', s_sex VARCHAR(10) NOT NULL DEFAULT '', PRIMARY KEY(s_id) );-- 课程表CREATE TABLE Course( c_id VARCHAR(20), c_原创 2021-01-14 14:38:13 · 399 阅读 · 0 评论 -
基于最大正向匹配算法的中文分词
package test.testAi;import java.util.ArrayList;import java.util.List;public class Test01 { public static void main(String[] args) { String[] words = new String[]{"我们","明天","去","郊游","打篮球","喝","风华正茂","书生意气"}; String message = "你好,明天天原创 2021-01-12 17:35:26 · 172 阅读 · 0 评论 -
常见排序算法的python实现
def bubble_sort(arry): n = len(arry) #获得数组的长度 for i in range(n): for j in range(1,n-i): if arry[j-1] > arry[j] : #如果前者比后者大 arry[j-1],arry[j] = arry[j],arry[j-1] #则交换两者 return原创 2021-01-11 17:25:51 · 112 阅读 · 0 评论 -
数据预处理和数据特征工程
数据预处理from sklearn.preprocessing import MinMaxScalerdata = [[-1,2],[-0.5,6],[0,10],[1,18]]import pandas as pdpd.DataFrame(data)scaler = MinMaxScaler() #实例化,默认在0~1之间,也可指定范围scaler = scaler.fit(data)result = scaler.transform(data)result#按极差缩放scaler原创 2021-01-11 15:24:25 · 171 阅读 · 0 评论 -
机器学习概述
原创 2021-01-11 13:35:35 · 101 阅读 · 0 评论 -
决策树、交叉验证、网格搜索练习
# coding: utf-8# In[1]:##导入依赖的包,数据采用红酒数据集from sklearn import treefrom sklearn.datasets import load_winefrom sklearn.model_selection import train_test_split##数据探索wine = load_wine()wine.data.shape#将数据转换为df格式:import pandas as pdpd.concat([pd.原创 2021-01-04 22:46:18 · 1003 阅读 · 1 评论 -
tensorflow预测波士顿房价
# coding: utf-8# In[59]:import tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltdef normalize(X): """ 归一化输入数据 """ mean = np.mean(X) # 均值 std = np.std(X) # 标准差 X = (X - mean)/std # Z-Score归一化,符合正态分布 retu.原创 2021-01-04 21:19:20 · 463 阅读 · 0 评论 -
一个聚类算法的例子
from sklearn import treefrom sklearn.datasets import load_winefrom sklearn.model_selection import train_test_splitimport pandas as pddata = load_wine()x = data.datay = data.target_namespd_data = pd.concat([pd.DataFrame(data.data),pd.DataFrame(data原创 2021-01-04 20:32:58 · 379 阅读 · 1 评论 -
一个逻辑回归算法的例子
from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_scoredat原创 2021-01-04 20:15:08 · 265 阅读 · 0 评论 -
一个随机森林算法的例子
# coding: utf-8# In[1]:get_ipython().magic('matplotlib inline')from sklearn.tree import DecisionTreeClassifierfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.datasets import load_wine# In[2]:wine = load_wine()type(wine)##.原创 2021-01-04 20:11:18 · 738 阅读 · 1 评论 -
一段python算法实战的代码
一段python算法实战的代码# coding: utf-8# In[1]:get_ipython().magic('matplotlib inline')import numpy as npimport pandas as pdfrom sklearn.linear_model import LogisticRegression as LR# In[2]:data = pd.read_csv("rankingcard.csv",index_col=0)# In[5]:原创 2021-01-04 19:53:48 · 445 阅读 · 0 评论 -
Spark 学习笔记01
Apache Spark™是用于大规模数据处理的统一分析引擎。速度快运行工作负载的速度提高了100倍。Apache Spark使用最新的DAG调度程序,查询优化器和物理执行引擎,为批处理数据和流数据提供了高性能。使用方便使用Java,Scala,Python,R和SQL快速编写应用程序。Spark提供了80多个高级运算符,可轻松构建并行应用程序。您可以 从Scala,Python,R和SQL Shell交互地使用它。Generality(通用性)Combine SQL, strea原创 2020-12-25 22:31:14 · 155 阅读 · 1 评论 -
hadoop学习笔记01
大数据的定义大数据指无法一段时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要进行新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产?那多大的数据才能叫做大数据?100万条 1000万个用户?大数据的特点Volume(海量、 Velocity(高速)、Variety(多样)、Value(低价值密度)大数据的应用场景物流仓储大数据分析系统助力商家细化运营、提升销量、节约成本。零售分析用户消费习惯、为用户购买商品提供方便,从而提高商品销量。旅游原创 2020-12-16 23:48:02 · 285 阅读 · 0 评论 -
python基础知识汇总01
#!/usr/bin/python3import fibo# 单行注释print("Hello, Python!")'''多行注释'''# python3 基本数据类型counter = 100 # 整型变量miles = 1000.0 # 浮点型变量name = "Hello,Python" # 字符串print(counter, miles, name)# 多个变量赋同一值counter = miles = 99print(counter, miles)# 多个原创 2020-09-15 15:44:32 · 213 阅读 · 0 评论