python代码
文章平均质量分 68
wangjian8976
这个作者很懒,什么都没留下…
展开
-
训练集/测试集同分布检验
在数据挖掘比赛中,很重要的一个技巧就是要确定训练集与测试集特征是否同分布,这也是机器学习的一个很重要的假设。但很多时候我们知道这个道理,却很难有方法来保证数据同分布。除了KS检验、overlap rate、KL散度、KDE核密度估计外,对抗验证Adversarial validation是利用机器学习模型去检测分布是否一致对抗验证是模型验证的一种,通常,我们在训练模型的时候,不会将所有的数据用于训练,而是留出部分数据(验证集)用于评估模型的效果,这样做可以一定程度减少过拟合,经常会使用的到的交叉验证有:留原创 2021-02-23 17:25:41 · 6887 阅读 · 1 评论 -
tensorflow2.0 keras 函数api 常用网络结构
1构建简单的网络1.1创建网络inputs = tf.keras.Input(shape=(784,), name='img')h1 = layers.Dense(32, activation='relu')(inputs)h2 = layers.Dense(32, activation='relu')(h1)outputs = layers.Dense(10, activation='softmax')(h2)model = tf.keras.Model(inputs=inputs, outp原创 2021-01-18 10:39:52 · 177 阅读 · 0 评论 -
python 连接Mysql和hive
python 连接Mysql和hive1、python 连接Mysqlimport pymysqlimport pandas as pd# 连接databaseconn = pymysql.connect( host=“你的数据库地址”, port=3306, user=“用户名”,password=“密码”, database=“数据库名”, charset=“utf8”)# 得到一个可以执行SQL语句的光标对象cursor = conn.cursor原创 2020-11-26 10:27:36 · 786 阅读 · 0 评论