- 博客(43)
- 资源 (9)
- 收藏
- 关注
原创 机器学习面试题库:K-means
需要注意的是,虽然质心选择是K-means聚类算法中一个重要的因素,但是对于大规模的数据集,通常可以通过多次迭代和加入合适的正则化方法等措施来减小初始质心对聚类结果的影响。同时,需要注意的是,K-means算法的评估指标存在一定的局限性,如聚类的结果依赖于初始质心的选择,存在可能陷入局部最优解的问题等。手肘法:通过计算不同K值下聚类结果的SSE(误差平方和)或SSB(组间平方和)值,观察这些指标与K值的关系,找到SSE或SSB下降速度趋于平稳的K值,即所谓的“肘部”位置,作为合适的聚类数。
2023-05-18 17:29:43 1406
原创 ERROR : Failed with exception Wrong file format. Please check the file‘s format.
原因:表存储格式与同步的数据格式不一致导致,有可能表是orc格式,文件是文本格式。解决方法:修改hive表的存储格式为textfile,代码如下。
2023-05-06 10:23:42 587
原创 【python】copy深拷贝与浅拷贝
浅拷贝:变量都指向同一个内存地址深拷贝:变量都有自己独立的内存地址,不受其他变量改变的影响举例子:import copya = [1, 2, 3, 4, ['a', 'b']]b = ac = copy.copy(a)d = copy.deepcopy(a)a.append(5)a[4].append('c')代码运行结果:a= [1, 2, 3, 4, ['a', 'b', 'c'], 5]b= [1, 2, 3, 4, ['a', 'b', 'c'], 5]c=
2022-05-06 17:32:26 827
转载 无法解析主机地址 “mirrors.163.com”
本文仅用作学习记录,预防再次遇到此问题Linux 解决wget:无法解决主机地址[root@Redhat abc]# wget http://mirrors.163.com/.help/CentOS6-Base-163.repo–2017-03-01 17:00:26-- http://mirrors.163.com/.help/CentOS6-Base-163.repo正在解析主机 mirrors.163.com… 失败:未知的名称或服务。wget: 无法解析主机地址 “mirrors.163
2022-01-25 00:25:41 8195
原创 docker部署启动rancher失败
本文档仅作为个人学习记录!1.未关闭selinux,第一次部署失败(根据红色字体排查得知)prepare base dir is set to /home/Smartbi_Base/registry_images/harbordocker: Error response from daemon: OCI runtime create failed: container_linux.go:345: starting container process caused "process_linux.go:
2021-11-17 18:30:13 5141
原创 Linux设置root默认密码
本文档仅作个人学习记录默认安装好的linux系统是没有设置root用户的密码的使用admin账号登陆sudo passwd 或者 sudo passwd root
2021-10-31 23:37:44 735
原创 新手小白:如何安装JAVA和配置环境变量
一、安装前准备1.在其他盘新建JAVA、JDK两个空白文件夹2.下载好安装包(x64为64位的)二、安装过程1.双击JDK安装包,出现安装向导界面,选择下一步2.更改安装路径(如果不需要更改,可以选择默认位置)!!!记住安装路径,配置环境变量需要用到将安装路径更改为你想要安装的位置(我这里安装到事先新建的JDK文件夹中),接着选择下一步3.等待几分钟等待几分钟后,会出现如下的界面继续更改路径,也可选择默认(我这里更改到新建的JAVA文件夹中
2021-01-23 21:08:04 949
原创 特征工程的内容
常见的特征工程包括:异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布,可以采用公式:log(1+x1+median)log(1+x1+median) 数据分桶: 等频分桶; 等距分桶; Best-KS 分桶(类似利用基尼指数进行二分类); 卡方分桶; 缺失值处理: 不处理(针对类似.
2020-10-22 11:24:13 1273
原创 ModuleNotFoundError: No module named ‘numpy.testing.decorators‘
导入鸢尾花数据时from sklearn.datasets import load_iris出现ModuleNotFoundError: No module named 'numpy.testing.decorators'错误原因及解决方法;numpy版本问题,需要更改numpy的版本. pip install numpy==1.17.0(也可以选择其他版本)scipy版本问题,numpy版本>1.18,而scipy的版本<=0.19,所以要更新scipy的版本,pip.
2020-09-08 16:38:00 11273 7
原创 python练习——探索 Chipotle 快餐数据
1. 将数据集存入一个名为 chipo 的数据框内import pandas as pdchipo = pd.read_csv('chipotle.tsv',sep='\t')知识点:读取csv文件 data=pd.read_csv('a.csv') 读取txt文件 data = pd.read_table('a.txt') 读取json文件 data=pd.read_json('a.json') 读取excel文件 ..
2020-09-08 16:26:38 13586 3
原创 kaggle比赛:房价预测(排名前4%)
第一次参加kaggle比赛,得分为0.11356,排名在前4%导入各种包import torchimport torch.nn as nnimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns from scipy.stats import normfrom scipy import statsimport syssys.path.append(".....
2020-05-25 16:55:15 14305 17
原创 CUDA安装显示NVIDIA UPDATE CORE失败
在cuda安装过程中会显示Nvidia Update core可以使用以下方法解决:第一步:使用压缩软件将文件夹里面的cuda_10.1.105_418.96_win10.exe程序解压第二步:删除这个Update.Core文件夹第三步:右键点击setup.exe,以管理员身份运行,最后等待安装...
2020-05-19 21:38:49 11031 2
原创 python读取scv文件显示:OSError: Initializing from file failed
读取csv文件的代码:data_basic = pd.read_csv('基础数据.csv',encoding='GBK')读取的时候会显示:OSError: Initializing from file failed,开始以为我的路径错误,查找当前的工作路径,发现我的路径没有错误,但是还是会显示OSError: Initializing from file failedimp...
2020-04-25 14:05:51 380 1
原创 python中文分词-JSONDecodeError错误
JSONDecodeError: Extra data: line 1 column 70 (char 69)错误解析:JSONDecodeError:额外数据:第1行第70列(char 69)你的json文件已经写入了内容,再次写入相同内容的时候,就会出现这样的错误解决方案:需要注意的是每次运行程序结束,如若需要再次运行时,要删除已生成的json文件再来运行程序,否则会继续对原文件...
2020-04-17 16:14:59 2337
原创 python中文分词-如何下载并安装jieba包
首先下载jieba包以下三种下载方式任选打开Anaconda Prompt或者cmd,输入pip install jieba 官网下载:点此进入官网https://pypi.org/project/jieba/ 可以在本博主上传的资源种下载第二步-安装jieba包全自动安装:easy_install jieba或者pip install jieba/pip3 inst...
2020-04-15 17:23:47 31548 4
原创 深度学习-丢弃法(模型调参问题)
增大迭代周期数,比较使用丢弃法与不使用丢弃法使用丢弃法:#定义神经网络模型,将各个层声明清楚#模型参数的初始化net=nn.Sequential( d2l.FlattenLayer(), nn.Linear(num_inputs,num_hiddens1), nn.ReLU(), nn.Dropout(drop_prob1),#drop_pr...
2020-04-12 22:45:35 1350
原创 深度学习-多层感知机的简洁实现
多层感知机的简洁实现,如何调整代码,由一个隐藏层变为三个隐藏层一个隐藏层#定义模型(一个隐藏层)num_inputs,num_outputs,num_hiddens=784,10,256#序列模型net=nn.Sequential( d2l.FlattenLayer(),#实现对x形状的转换 nn.Linear(num_inputs,num_hiddens),#H...
2020-04-07 18:23:02 398
原创 深度学习--安装CPU版本的PyTorch
一、安装运行环境推荐大家安装Anaconda。事先安装好Anaconda.二.打开命令行窗口(cmd)三.安装CPU版本的PyTorch在命令行窗口根据自己的python版本输入相应的代码查看自己python版本的方法,点击可查看Python3.5版本:pip install https://download.pytorch.org/whl/cpu/torch-1.0.0-cp35-...
2020-04-05 01:03:42 1351
原创 深度学习-梯度消失和梯度爆炸
1、梯度消失和梯度爆炸的定义梯度消失在神经网络中,当前面隐藏层的学习速率低于后面隐藏层的学习速率,即随着隐藏层数目的增加,分类的准确率反而下降。这种现象称为梯度消失。梯度爆炸在神经网络中,当前面隐藏层的学习速率高于后面隐藏层的学习速率,即随着隐藏层数目的增加,分类的准确率反而下降。这种现象称为梯度消失。梯度消失和梯度爆炸是一样的,但是产生的原因不一样。!!!梯度消失和梯度爆炸属于梯度不...
2020-04-04 20:44:42 431 1
原创 深度学习-多层感知机的从零开始实现
如何增添代码,在一个隐藏层的基础上加入一个新的隐藏层,变为两个隐藏层单层感知机:#一个隐藏层num_inputs,num_outputs,num_hiddens=784,10,256#隐藏层的权重参数和偏置参数W1=torch.tensor(np.random.normal(0,0.01,(num_inputs,num_hiddens)),dtype=torch.float)b1=to...
2020-04-04 19:20:39 424
原创 决策树算法实现-可视化环境搭建
*!!!注意安装步骤 *1. 绘图软件的安装(graphviz)[1] 安装程序(graphviz-2.38.msi)[2] 软件下载地址:http://www.graphviz.org/[3] 安装过程不用修改任何设置。[4] 注意留意安装过程中,软件的安装目录位置,后面要用到此位置。[5] 在python脚本中设置系统的环境变量如下:import os os.environ...
2020-04-04 12:58:19 230
原创 JAVA-数据库条件查询
实验要求:编写一个应用程序,连接SQL Server数据库Stu,并访问数据库中grade表,并可以通过课程号下拉表列选择课程号,并将表中的内容输出在窗口界面的表格中 。如下图所示:代码:import java.awt.BorderLayout;import java.awt.event.ItemEvent;import java.awt.event.ItemListener;...
2020-04-01 19:41:43 3035
原创 JAVA-数据库顺序查询
实验要求:编写一个应用程序,连接SQL Server数据库Stu,并访问表中的内容输出如下图所示:数据库内容java界面显示内容:代码:import java.sql.*;public class test { public static void main(String args[]){ String url="jdbc:sqlserver://localhost:143...
2020-04-01 19:34:11 614
原创 JAVA-文件字节输入流与输出流
要求:编写一个应用程序,从文件a.txt中读取数据,筛选出文件中的数字字符,并将其转换成double类型是,对所有的数据求和,并求出平均值,把数据数组与计算结果输出到文件b.txt中。如图:代码:import java.io.*;import java.util.Arrays;public class test { public static void main(String ...
2020-03-29 20:53:58 672
原创 JAVA-树组件与表格组件
要求:建立图书馆目录索引的树型目录,并显示书籍的相关信息。代码:public class test{ public static void main(String args[]){ TreeWin win = new TreeWin(); } }public class book{ String name; String chubans...
2020-03-29 20:41:19 763
原创 java-Dialog对话框
要求:1.编写一个应用程序,窗口中通过按钮input,弹出一个输入对话框,并在对话框中输入字符串inputText,并对inputText进行处理,要求提取文本中的数字数据,并对数组进行排序之后,输出在文本区域output中,同时显示求和的结果与平均值。通过按钮find,可以弹出一个输入框,可供输入数据num,并实现在数组中查找num,查找的结果用message的对话框显示。如图所示...
2020-03-29 20:30:26 1240
原创 JAVA-KeyEvent事件响应的处理方式
要求:界面如图,应用程序可能通过键盘上的方向键(上,下,左,右) 控制按键分别向对应的方向移动。代码:public class test { public static void main(String args[]){ Win win=new Win(); win.setTitle("KeyEvent事件"); win.setBounds(20,20,400,350);...
2020-03-29 18:01:08 810
原创 java-掌握MouseEvent事件响应的处理方式
要求:编写应用程序,拖动图片到目标区域,使之重合,并给出重合提示显示,如图:代码: public class test { public static void main(String args[]) { WindowMove win=new WindowMove(); win.setTitle("处理鼠标拖动事件"); win.setBo...
2020-03-29 17:56:20 916
原创 JAVA-掌握DocumentEvent事件响应的处理方式。
要求:编写应用程序,有一个标题为“计算”的窗口,窗口中添加两个文本区textInput和textShow,当在textInput中输入若干个数时,textShow同时对textInput中的数进行求和运算,并求出平均值代码如下:package 实验6;public class test { public static void main(String args[]){ Windo...
2020-03-29 17:42:43 610
原创 深度学习-如何下载以及导入Datasets数据集
mnist_train=torchvision.datasets.FashionMNIST(root='C:/Users/Lenovo-s41/Datasets/FashionMNIST/', train=True,download=False, ...
2020-03-29 16:22:45 5621
原创 JAVA-itemevent事件响应的处理方式
1.创建一个信息栏,输入和选择自己的信息,将信息显示在文本框内。代码:public class test {public static void main(String args[]) {ComponentInWindow win=new ComponentInWindow();win.setTitle(“个人信息”);win.setBounds(100,100,310,260);...
2020-03-26 14:51:15 880
原创 JAVA-actionevent事件响应的处理方式
1.处理东、南、西、北四个按钮,以及文本框的actionevent事件。当事件发生,,监视器计算字符的长度,并在命令行窗体显示按钮的文本内容或文本框的文本内容。代码:package 实验4;public class test {public static void main(String args[]){WindowActionEvent win= new WindowActionE...
2020-03-26 14:30:10 2984 1
原创 JAVA-掌握布局与界面的建立与嵌套
要求:利用BoxLayout布局容器的嵌套建立一个窗口界面如图代码:package 实验3;public class test {public static void main(String args[]){WindowBoxLayout win=new WindowBoxLayout();win.setBounds(100,100,310,260);win.setTitle(“...
2020-03-26 14:18:09 1259
原创 JAVA-掌握理解容器与窗口布局,并创建带组件
要求:创建一个3*3网格布局的面板JP,网格中的每个单元格放置一个按钮组件,按钮上显示的文本内容是该按钮在网格中的行列位置,在底层容器JFrame建立 的对象JF上加载JP,并显示。如下图:代码:import java.awt.;import javax.swing.;import java.awt.event.*;public class test {public static...
2020-03-26 14:12:42 354
原创 JAVA--建立一个可输入个人信息的窗口
要求:窗口建立一个窗口用于输入个人信息,内容包括学号(文本框),姓名(文本框),学院(下拉表列),专业(下拉表列),性别(单选),爱好(多选),特长(文本区域)如下图所示代码:package 实验二;public class test {public static void main(String args[]){ComponentInWindow win = new Compon...
2020-03-26 14:06:13 5398
jieba-0.42.1.zip
2020-05-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人