乐在么么茶-CSDN博客

原创用python自动化定时发送邮件(普通文本，html，图片，附件等)_亲测有效

这周有需求将Bi报表每天定时，自动的群发给team成员，今天搜集资料完成了这个需求，可以发送普通文本，图片，附件已经html形式将其展现出来，整套代码如下；已亲测可行，相关信息已脱敏~写完脚本后登陆控制面板->管理工具->任务计划程序可以给脚本设定定时执行的任务，相关操作步骤可以参考如下：如何在windows服务器上面创建定时任务 - 施勇 - CSDN博客#!/usr...

2018-12-21 15:10:33 2326

原创如何用python连接Hive_亲测有效_18.12.20

(原创，亲测有效,转载注明出处)最近一直在尝试用python3.6连接Hive数据库(windows系统下利用Pyhive)，在安装好各种包后连接仍会报如下错误花了几个小时在国内外论坛上找了很多种方法都没有解决，后来在自己装了个linux虚拟机，配置了和windows相同的python环境，用Python连接后报了登录错误（validating the login）; 头疼ing......

2018-12-20 10:45:15 887

原创 Github最新注册及使用教程

GitHub是一个用于版本控制和协作的代码托管平台；有repositories, branches, commits, and Pull Requests等重要的概念(1)注册：①进入https://github.com/，填写账户密码及邮箱②登录账号及邮箱进行账户验证③重新登录账户即可(2)使用：①主要将介绍以下内容： a：如何创建和使用存储库 b：如...

2018-12-12 21:34:23 1361

原创 Dbeaver下载&安装&配置流程及在python中的封装

①下载流程:https://dbeaver.io/download/ ②安装流程如下： ③配置流程如下： a. 打开工具栏>>数据库>>新建连接 b. 连接类型选择Hadoop>>...

2018-11-19 11:42:55 3231

P分位:P取0~1之间的任何数值P分位所在位置计算公式：pos = 1+(n-1)*p公式2：value=i+(j-i)*fraction如：P分位的数值是指先将所有数据从大到小排列，若P分位的位置通过上述公式计算后为整数，则直接取P分位所在处的数值；若为小数，则表示该位置在两个数之间，则用公式2计算出对应的值（分位距fraction为小数部分,i,j为分位前后的数值）例子：df = pd.Dat...

2018-04-08 11:39:08 23851

原创过拟合，欠拟合与模型调整

①欠拟合即不能准确的拟合训练集数据；即训练集的损失函数高，得分低欠拟合对交叉测试集(或其他新数据集)的预测能力也较差，即交叉测试集的损失函数高，得分低；欠拟合属于高偏差，即拟合曲线与真实曲线的值的偏差较大(如用一次函数来拟合类三次函数的数据)②过拟合即过分拟合训练集中的数据，即训练集的损失函数低，得分高过拟合对交叉测试集(或其他新数据集)的预测能力较差；即交叉测试集的损失函数高，...

2018-04-01 13:33:35 1048

原创查准率和召回率判断模型好坏

查准率：预测为1的数据中，真的是1的比例。sklearn.metrics.precision_score()召回率：真的是1的数据中，被预测为1的比例 sklearn.metrix.recall_score()F1Score=2*PR/(P+R) 来判断模型的好坏；sklearn.metrix.f1score() 理想状态是预测是1的全部真的是1（即查准率=1）&真的是1的全部被预测是1...

2018-04-01 13:07:08 911

原创 SKlearn库——(2)朴素贝叶斯分类

模块：sklearn.naive_bayes理论基础：每队特征之间相互对立；其需要的训练数据比较少，通过计算属于每个类的概率并取概率最大的类作为预测类共有三类：①高斯贝叶斯（from sklearn.naive_bayes import GaussianNB） ②多项式模型贝叶斯（from sklearn.naive_bayes import Mul

2018-01-08 23:45:12 818

原创 KNN实战_改进约会网站的配对效果

这次用KNN算法实战了改进约会网站的配对效果，将代码和思路记录下来作为以后思考和改进的模版，其中③K-临近算法实现代码可以用sklearn中的KNeighborsClassifier()代替import numpy as npimport operatorfrom sklearn.neighbors import KNeighborsClassifierimport matplotlib.pyp

2017-12-31 01:15:16 417

原创 SKlearn库——监督学习之分类（Classification）(1)

（1）广义线性模块： sklearn.linear_model（2）支持向量机模块：sklearn.svm（3）最临近模块：sklearn.neighbors（4）高斯过程模块：sklearn.gaussian_process（5）朴素贝叶斯模块：sklearn.naive_bayes（6）决策树模块：sklearn.tree（7）集成模块：sklearn.ensemble

2017-12-28 21:31:02 2530

原创多元线性回归

用到sklearn库中的linear_model模块：①Linear.Regression()类②Ridge()类①Linear.Regression()：通过求实际观测值与预测值的差的平方的最小值求得参数w；数学公式：（即最小二乘法）from sklearn import linear_modelX=[[0,0],[1,2],[2,2],[4,5],[5,100]]y=[

2017-12-26 03:15:19 280