- 博客(53)
- 资源 (5)
- 问答 (6)
- 收藏
- 关注
原创 机器学习案例:加州房产价格(五)
要解决这个问题,一个常见的方法是给每个分类创建一个二元属性:当分类是<1H OCEAN,该属性为 1(否则为 0),当分类是INLAND,另一个属性等于 1(否则为 0),以此类推。现在,你就可以使用这个“训练过的”imputer来对训练集进行转换,将缺失值替换为中位数,结果是一个包含转换后特征的普通的 Numpy 数组。通过前面的工作,你应该注意到了属性total_bedrooms有一些缺失值,缺失值的处理是需要着重解决的。大多机器学习算法不能处理缺失的特征,因此先创建一些函数来处理特征缺失的问题。
2024-05-18 16:35:20 594 1
原创 机器学习案例:加州房产价格(四)
这张图也呈现了一些不是那么明显的直线:一条位于 450000 美元的直线,一条位于 350000 美元的直线,一条在 280000 美元的线,和一些更靠下的线。你可以看到,纬度和房价中位数有轻微的负相关性(即,越往北,房价越可能降低)。尽管北加州海岸区域的房价不是非常高,但离大海距离属性也可能很有用,所以这不是用一个简单的规则就可以定义的问题。通过之前的工作,你只是快速查看了数据,对要处理的数据有了整体了解,现在的目标是更深的探索数据。另外,如果训练集非常大,你可能需要再采样一个探索集,保证操作方便快速。
2024-05-14 09:42:21 740
原创 机器学习案例:加州房产价格(二)
参考链接:https://hands1ml.apachecn.org/2/设计好系统后,要开始在工作区编写代码来解决问题了。
2024-05-12 14:58:58 694
原创 机器学习案例:加州房产价格(一)
参考链接:https://hands1ml.apachecn.org/2/假设你是被一家地产公司雇佣的数据科学家,现在需要做一些工作。公司所给的数据集是StatLib 的加州房产价格数据集。这个数据集是基于 1990 年加州普查的数据。数据已经有点老,但它有许多优点,利于学习,所以假设这个数据为最近的数据。为了便于学习理解,稍后学习过程中添加了一个类别属性,并除去了一些。你的第一个任务是利用加州普查数据,建立一个加州房价模型。这个数据包含每个街区组的人口、收入中位数、房价中位数等指标。
2024-05-12 14:24:11 530
原创 2.监督/非监督学习
参考链接为:https://hands1ml.apachecn.org/1/机器学习可以根据训练时监督的量和类型进行分类。主要有四类:监督学习、非监督学习、半监督学习和强化学习。本文将简单介绍监督学习和非监督学习。
2024-05-11 14:36:17 803
原创 1.理解机器学习
虽然并不是一个有自我意识的天网系统(Skynet),垃圾邮件过滤器从技术上是符合机器学习的(它可以很好地进行学习,用户几乎不用再标记某个邮件为垃圾邮件)。后来出现了更多的数以百计的机器学习产品,支撑了更多你经常使用的产品和功能,从推荐系统到语音识别。相反的,基于机器学习技术的垃圾邮件过滤器会自动学习哪个词和短语是垃圾邮件的预测值,通过与普通邮件比较,检测垃圾邮件中反常频次的词语格式。大多数人听到“机器学习”,往往会在脑海中勾勒出一个机器人:一个可靠的管家,或是一个可怕的终结者,这取决于你问的是谁。
2024-05-10 16:31:36 305
原创 Js逆向简单分析-某网站登录案例
都为:e10adc3949ba59abbe56e057f20f883e,至此确认为md5加密.将e10开头的数据进行分析,发现长度为32,猜测是md5类型数据加密。但txtpassword作为密码和我们输入的123456不一样,与我们刚才输入数据进比对,发现txtusername一致,在控制台测试下这个函数hex_md5,得出e10开头的结果。通过分析得出,密码为hex_md5函数进行加密。F12打开网络,并点击立即登录进行流量包分析。发现与我们刚才分析得出的加密字段一致。与之前在流量包看到的一致。
2024-03-30 14:42:57 441
原创 计算机网络基本知识(一)
单位时间内通过某个网络(或信道、接口)的数据量。安检的履带检查物品,如手机、电脑、行李。式子:时延带宽积 = 传播时延 x 带宽。带宽变大,单位时间内传输的数据更多了。单位:kb/s,kb/s,Mb/s。从上图看出往返时延为30ms左右。主机之间链路上有多少时间有数据流。数据流大,就像车道上车太多会堵车。网络的通信线路传送数据的能力。比如上面图片还在链路上的比特。末端处理:接收方进行处理。记忆要点:10的三次方。记忆要点:2的10次方。所以看电磁波的传播速率。堵车就车走的比平时慢了。
2024-02-08 17:37:00 971
原创 计算机网络概念、组成、功能和分类
计算机网络是互连的、自治的的计算机集合(互连:互联互通 通信链路,自治:无主从关系)通信设备:比如路由器、路由器 线路:将系统和通信设备两者联系的介质之类的。
2024-02-07 21:51:11 940
原创 ip、子网掩码和A、B、C段
这个子网掩码可以用来划分一个IP地址空间,使得前19位表示网络,后面的13位表示主机。子网掩码通常以连续的1和0组成,其中1表示网络部分,0表示主机部分。这里前面的19位都是1,表示网络部分,后面的13位是0,表示主机部分。要求主机号的话,要将子网掩码的二进制取反,再和ip的二进制进行与运算,得到的结果转为十进制就是主机号。IP地址和子网掩码在网络中密切关联,共同用于确定一个设备属于哪个网络以及如何划分网络中的主机。总的来说,IP地址和子网掩码共同工作,帮助确定设备的网络位置,确保它们能够正确地进行通信。
2024-02-05 15:42:45 1572
原创 网桥与网关
网桥:网桥也叫桥接器,是连接两个局域网的一种存储/转发设备,它能将一个大的LAN分割为多个网段,或将两个以上的LAN互联为一个逻辑LAN,使LAN上的所有用户都可访问服务器。网关:网关是一个大概念,不具体特指一类产品,只要连接两个不同的网络的设备都可以叫网关;最简单的网桥有两个端口,复杂些的网桥可以有更多的端口。网桥的每个端口与一个网段相连。换句话说,路由器可以实现网关的功能,但是路由器功能不仅仅是实现网关;与网桥只是简单地传达信息不同,当信息到达网关以后,网关要对信息重新进行加工,以适应目的系统的需求。
2024-02-05 14:33:25 1660
原创 云服务介绍
云服务,顾名思义就是云上的服务,简单的来说就是在云厂商(例如 AWS、阿里云)那里买的服务。目前国内云厂商有阿里云、腾讯云、华为云、天翼云、Ucloud、金山云等等,国外有亚马逊的 AWS、Google 的 GCP、微软的 Azure 等等。总的来说,云服务为组织提供了灵活性、成本效益和可伸缩性,但在使用云服务时,安全性、合规性和数据隐私等问题必须得到妥善处理。顶级的安全专家应该密切关注最新的威胁趋势和最佳实践,以确保在云环境中保持数据和应用程序的安全性。
2023-10-24 13:33:56 189
原创 DWT与图像转换——Python和Matlab实现(完整解析版)
提取:将原载体图像进行二级离散小波变换得到三级分辨率级下的多个个细节子图,取cH2,cV2,cD2和一个逼近子图cA,嵌入后的载体图像进行二级离散小波变换得到一级分辨率下的一个逼近子图ca和三个细节子图chl,cvl,cd1,再计算并重构水印图像。将原载体图像进行二级离散小波变换得到三级分辨率级下的多个个细节子图,取cH2,cV2,cD2和一个逼近子图cA,嵌入后的载体图像进行二级离散小波变换得到一级分辨率下的一个逼近子图ca和三个细节子图chl,cvl,cd1,再计算并重构水印图像。
2023-06-15 11:00:42 897
原创 src学习记录(二)
如果错误信息中包含恶意语句,语句将被执行。log4j的漏洞,向服务端的jndi context lookup的时候连接自己的rmi服。关键点:st2-045的漏洞,所有问题都出现在Content-Type字段上。务器,服务端连接rmi服务器执行lookup的时候会通过rmi查询到该地址指。中写入逻辑,就会在服务端(jndi rmi过程中的客户端)实例化的时候执。黑客在自己的客户端启动一个带有恶意代码的rmi服务,通过服务端的。向的引用并且本地实例化这个类,所以在类中的构造方法或者静态代码块。
2023-05-12 20:38:10 577 1
原创 SQL-起始id不为1时的修改方法
这条语句将把新的自增长列new_id重命名为id,并且把id设置为新的自增长列。其实不用什么临时表或者清空后重新插入数据,只要如下SQL代码。这条语句将在表中更新新的自增长列,将它从1开始递增。1.这条语句将在表中添加一个新的列new_id。2.设置新的列new_id初始值为0。作为主键的id没有从1开始自增,如下。3.删除原有的自增长列。4.重命名新的自增长列。创建一个新的自增长列。
2023-04-19 20:11:58 411 2
原创 机器学习记录(二)
在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。总结来说,groupby的过程就是将原有的DataFrame按照groupby的字段(这里是company),划分为若干个分组DataFrame,被分为多少个组就有多少个分组DataFrame。在Pandas中,上述的数据处理操作主要运用groupby完成。
2023-04-02 19:40:47 241
原创 机器学习记录(一)
若数据服从正态分布,则异常值被定义为一组结果值中与平均值的偏差超过三倍标准差的值。即在正态分布的假设下,距离平均值三倍 \sigma(标准差)之外的值出现的概率很小(如下式),因此可认为是异常值。若数据不服从正态分布,也可以用远离平均值的多少倍标准差来描述(这就使该原理可以适用于不同的业务场景,只是需要根据经验来确定 k sigma中的k值,这个k值就可以认为是阈值)。描述性统计数据:数值类型的包括均值,标准差,最大值,最小值,分位数等;类别的包括个数,类别的数目,最高数量的类别及出现次数等;
2023-04-02 11:10:37 361
原创 centos7-redis安装配置
序号操作1注释bind 127.0.0.1 或者改成bind 0.0.0.02pro的那个参数改成no3防火墙策略记得添加远程端口6379(或者自己修改过后的端口)4注意自己的系统是否安装多个redis,在懒得添加环境变量的情况下,请自行到相应的目录下执行启动命令,比如到redis的目录下执行 ./redis-server /usr/local/redis/redis.conf。
2022-11-07 23:57:36 654 1
原创 关于一次前端接口加解密的error记录
正常读取数据,列表嵌套列表的格式,噢对到这里也要说明一下密钥被我定为64位固定字符串了(符合des加密密钥长度的字符串都可以)对于引号包裹的json格式数据,采用这个函数方法相当于去除引号的同时又将其转换位object格式,直接满足我的要求。到这里挺清晰的了,我们要做的就是返回的解密数据能变为可处理的就好了,这样后面的容器体循环遍历就可以方便使用了。就用flask框架,编写其中的ajax接口,然后这个接口呢,要有那么一点点要求。欸,我的列表嵌套列表呢?好吧就是接下来的解密遇到的bug让我处理了好几天!
2022-10-06 22:45:22 822
原创 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position 83: illegal
这边就是见怪不怪的编码问题,进入subprocess.py文件修改。将encoding=None修改为encoding=‘utf-8’在使用python的execjs调用执行js文件的函数时,也就是类Popen的初始化函数__init__修改好后就不会出现如上报错了。
2022-08-21 15:29:31 605 1
原创 python--利用os模块读取指定目录下所有文件名
os就是“operatingsystem”的缩写,顾名思义,os模块提供的就是各种Python程序与操作系统进行交互的接口。通过使用os模块,一方面可以方便地与操作系统进行交互,另一方面页可以极大增强代码的可移植性。首先找到了os.listdir可以读取指定路径下所有文件和文件夹的名字。比如我创建了一个文件夹,里面包含了1.txt,文件夹2,3.doc。既然我们要打印的是文件名字,那么遇到文件夹就应该再“扫描”一次。而我们想要的是读取指定路径下所有文件的名字!首先,先确认当前读到的是文件还是文件夹。...
2022-07-20 12:41:12 10673 2
原创 第 6 章 异常处理、递归
Java系列文章第1章 绪论第2章 结构化程序设计第4章 数组、字符串、向量文章目录Java系列文章异常处理一、介绍什么是异常(Exception)?异常的分类常见的异常二、异常处理中五个关键字1.范例一2.范例二3.要点递归一、介绍二、实例提示:以下是本篇文章正文内容,下面案例可供参考异常处理一、介绍什么是异常(Exception)?异常是正常程序流程所不能处理或没有处理的异常情况或异常事件,也称为例外。异常的分类来源:Java异常的分类和类结构图常见的异常jav
2022-05-08 21:29:05 432
原创 第4章 数组、字符串、向量
文章目录前言一、数组前情提要:数据类型回顾数组概念数组的组成一维数组一维数组声明一维数组创建访问数组元素注意事项多维数组二、字符串简单的字符串构造字符串长度连接字符串字符串方法三、类StringBuffer与String的区别:介绍构造方法四、向量向量概念介绍创建向量实例对象操作向量添加元素向量访问元素向量删除元素前言有关Java数组、字符串、向量的基础知识提示:以下是本篇文章正文内容,大家可以选择自己感兴趣部分阅读一、数组前情提要:数据类型回顾数组概念数组是具有相同数据类型的一组数
2022-05-06 19:52:48 586 3
原创 MD5密码实验——Python实现(完整解析版)
前言实验目的1)初步了解哈希算法2)掌握哈希算法MD5的实现提示:以下是本篇文章正文内容,下面案例可供参考实验环境计算机语言:Python开发环境:Pycharm实验内容编程实现MD5算法。实验操作步骤暂略实验结果1.明文:12345678密文:25d55ad23a80aa4f464c76d713c07ad与在线.
2022-05-05 15:45:44 14848 29
原创 第2章 结构化程序设计
1、Java标识符和关键字的概念。标识符标识符可以用来表识文件名、变量名、类名和类里的方法名组成java字母 + java数字注意1.首字符必须是Java字母2.所有标识符是区分大小写的3.除去关键字、false、true和null |Java字母A~Z, a~z,下划线“_ ”,美元符号“$”,等Java数字0~9,等标识符2、Java的数据类型包括哪些?每一种数据类型占用的位数是多少?定义方式是怎样?每一种数据类型占用的位数(即内存空
2022-05-03 20:29:58 404
原创 第1章 绪论
1、Java语言的特点列举几个特性简单性:1.相较于其他语言 Java没有结构,数组和串都是对象,所以不需要指针。2.Java能够自动处理对象的引用和间接引用,实现自动的无用单元收集,使用户不必为存储管理问题烦恼,能更多的时间和精力花在研发上。面向对象:1.Java是一个面向对象的语言2. 在一个面向对象的系统中,类(class)是数据和操作数据的方法的集合。数据和方法(method)一起描述对象(object)的状态和行为。3.Java还包括一个类的扩展集合,分别组成各种程序包(P
2022-05-02 15:23:48 461
转载 MySQL去除重复数据,保留一条数据
(A)、 使用 DELETE JOIN 语句删除重复行二(B)、使用一个中间表来删除重复的行二(C)、使用 ROW_NUMBER() 函数删除重复的行例如:最近做一些sql语句处理表时,需要删除重复的数据并且保留一个,在网上看到这篇文章后觉得收获颇多,特此分享转载链接:MySQL去重留一以下是转载部分参见:https://www.mysqltutorial.org/mysql-delete-duplicate-row
2022-04-28 20:47:19 15106
原创 DES密码实验-C语言实现
前言实验目的1)初步了解对称密码2)掌握数据加密标准DES的实现实验方法根据PPT中关于DES加解密算法的描述,用所熟悉的语言,完成实验内容、描述实验操作步骤、实验结果与实验心得。实验环境计算机语言:C语言开发环境:Dev-C++实验内容1.编程实现DES算法,要求有加密步骤和解密步骤。2. DES算法作为密码体制中的对称密码体制,明文按64位进行分组,密钥长64位,密钥实际是56位参与DES运算,另外的8位被
2022-04-28 20:16:48 4931
请问设置了unsigned后,为什么-255变成了256(我看有些文章说会插入失败)
2022-07-22
vscode遇到代码扩展报错:XHR failed
2022-07-16
请求一道有关Java数组的问题
2022-05-15
请师傅补充代码,在void Best_allocate(int request)/*最佳适应分配函数,根据申请的request字节数来分配空间*/ { }这个模块,关于内存管理算法模拟
2021-12-12
执行如下python代码,分别输入整数9和10,结果相同都为3628800,哪里出错了?
2021-09-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人