- 博客(101)
- 资源 (12)
- 收藏
- 关注
原创 机器学习(一)
机器学习是从数据中自动分析获取模型,并利用模型对未知数据进行预测。数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。意义:会直接影响机器学习的效果。在特征工程里面,我们使用的是sklearn,而不是pandas(数据清洗、数据处理)。对于归一化来说:如果出现异常点,影响了最大值和最小值,那么结果显示会发生变化。
2024-06-17 08:30:39 2431
原创 推荐系统架构
整篇文章从系统架构梳理了Netfliex的经典推荐系统架构,整个架构更多是偏向实时性能和效果之间tradeoff的结果。如果从另外的角度看推荐系统架构,比如从数据流向,或者说从推荐系统各个时序依赖来看,就是我们最熟悉的召回、粗排、精排、重排、混排等模块了。这种角度来看是把推荐系统从前往后串起来,其中每一个模块既有在离线层工作的,也有在在线层工作的。而从数据驱动角度看,更能够看到推荐系统的完整技术栈,推荐系统当前面临的局限和发展方向。召回、排序这些里面单拿出任何一个模块都非常复杂。
2024-10-15 12:15:39 1011
原创 推荐系统的意义
随着移动互联网的飞速发展,人们已经处于一个信息过载的时代。在这个时代中,推荐系统就是一个将信息生产者和信息消费者连接起来的桥梁。平台往往会作为推荐系统的载体,实现信息生产者和消费者之间信息的匹配。上述提到的平台方、信息生产者和消费者可以分别用平台方(如:腾讯视频、淘宝、网易云音乐等)、物品(如:视频、商品、音乐等)和用户和来指代。下面分别从这三方需求出发,介绍推荐系统的存在的意义。
2024-10-10 21:12:24 1133
原创 深度学习(二)
TFRecords其实是一种二进制文件,虽然它不如其他格式好理解,但是它能更好的利用内存,更方便复制和移动,并且不需要单独的标签文件。使用步骤:获取数据将数据填入到 Example 协议内存块(protocol buffer)将协议内存块序列化为字符串,并且通过 tf.python_io.TFRecordwriter 写入到TFRecords文件。文件格式*.tfrecords。
2024-07-15 08:59:55 1509
原创 深度学习(一)
方面机器学习深度学习特征提取手动完成,需要大量领域专业知识。深度学习通常由多个层组成,它们通常将更简单的模型组合在一起,将数据从一层传递到另一层来构建更复杂的模型。通过训练大量数据自动得出模型,不需要人工特征提取环节。适用于在难提取特征的图像、语言、自然语言处理领域。数据量和计算性能要求执行时间短执行时间长,因为深度学习参数往往很庞大,需要通过大量的数据的多次优化来训练参数。算法代表朴素贝叶斯算法、决策树等神经网络框架名主语言从语言灵活性上手难易开发者Tensorflow。
2024-07-08 09:49:56 1940
原创 机器学习(三)
欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在测试数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模拟过于简单)过拟合:一个假设在训练数据上能够很好的拟合,但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂) 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。
2024-07-01 10:05:11 1924
原创 如何免费的去使用connectedpapers?
输入网址:https://www.connectedpapers.com/之后就可以再接着使用。
2024-06-24 12:42:10 1055
原创 机器学习(二)
核心思想:根据你的”邻居“来推断出你的类别。定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于一个类别,则该样本也属于这个类别。其中k值不能太小,容易受到异常值的影响。不能太大,会受到样本不均衡的影响。欧式距离曼哈顿距离闵可夫斯基距离优点:简单、易于理解、易于实现、无需训练(KNN 是一种懒惰学习(lazy learning)算法,这意味着它在训练阶段并不构建模型,而是在测试阶段才进行计算。缺点:懒惰算法,对测试样本分类时计算量大,内存开销大。
2024-06-24 09:55:01 1707
原创 自己用pip下载好模块啦,但是在pycharm里面不显示?
今天在cmd里面用pip命令安装第三方模块,最后用pip list 命令发现已经成功安装,但是在pycharm里面用该模块的时候,还是爆红,显示没有该库。新建项目勾选这个选项。选择全局的解决解释器。
2024-06-12 17:59:13 1498
原创 Django基础学习
1.快速开发网站创建项目并导入flask框架,然后建立网址和函数的对应关系。Flask框架为了让写标签方便,支持将字符串写入到文件里面。2.HTML(超文本传输语言)的结构及标签2.1 HTML的结构2.2 标签2.2.1 div和spandiv : 块级标签span: 自己多大占多大,行内标签2.2.2 超链接2.2.3 图片小结2.2.4 列表标签2.2.4 表格2.2.5 input系列2.2.6 下拉框2.2.7 多行文本补充:在hea
2024-06-03 08:59:51 2085
原创 python核心编程(二)
本文深入探讨了面向对象编程的基本理论和实践。首先介绍了面向对象编程的基本概念,包括对象、类、封装、继承和多态等。然后详细讲解了Python对象的生命周期,包括对象的创建、初始化、使用和销毁等过程。最后,文章深入讨论了面向对象编程的三大特性,即封装、继承和多态,并通过Python代码示例展示了这些特性的应用。通过本文,读者可以全面了解面向对象编程的基本理论和实践,为编写高质量的Python代码打下坚实基础。
2024-05-27 11:27:49 1142
原创 python核心编程(一)
这篇博文深入探讨了Python中的函数,包括概念、使用方法、参数传递、返回值、描述文档、作用域、相关内置函数等内容,并从面向对象的角度解析了Python中函数的面向对象特性。文章结构清晰,内容丰富,是学习Python函数和面向对象的不错选择。
2024-05-20 18:55:00 1405 1
原创 python基础语法
特点:简单、优雅、可移植性、代码规范性、运行效率低。应用领域:web全站开发、大数据、人工智能、数据爬虫等等。python 解释器:将源码转换成为二进制代码进行运行。
2024-05-13 20:34:37 2292 1
原创 计算机网络(第7版谢希仁)笔记
1、三大类网络:电信网络、有线电视网络、计算机网络。电信网络:提供电话、电报及传真服务。有线电视网络:向用户传送各种电视节目。计算机网络:使用户能在计算机之间传送数据文件。发展最快的并起到核心作用的是计算机网络。计算机网络主要是由一些通用的、可编程的硬件互连而成的,而这些硬件并非专门用来实现某一特定目的(例如,传送数据或视频信号)。这些可编程的硬件能够用来传送多种不同类型的数据,并能支持广泛的和日益增长的应用。计算机网络的特点:连通性、共享。
2024-04-18 18:34:46 1758 1
原创 计算机操作系统(第四版)汤小丹
1、概念:操作系统是指控制和管理整个计算机系统的硬件和软件资源,并合理组织和调度计算机的工作和资源分配,是最基本的系统软件。2、操作系统的目标与应用环境有关。3、操作系统的四个目标:方便性、有效性 、可扩充性、开放性。OS作为用户与计算机硬件系统之间的接口OS作为计算机系统资源的管理者。可将这些资源分为四类:处理机、存储器、I/O设备以及文件(数据和程序)。处理机管理是用于分配和控制处理机;存储器管理主要负责内存的分配与回收;I/O设备管理是负责I/O设备的分配(回收)与操纵;
2024-04-18 18:22:57 1709
原创 计算机网络第四章习题
连接到互联网的主机只需拥有统一的 IP 地址,它们之间的通信就像连接在同一个网络上那样简单方便。另外,网络技术是不断发展的,网络的制造厂家也要经常推出新的网络,在竞争中求生存。答:可以是C类地址对应的子网掩码默认值,也可以是A类或B类地址的掩码,这时主机号由最后8位决定,而路由器寻找网络由前24位决定。答:A类网络的掩码前面有8个1,子网号subnet-id用了16个1,因此掩码有 24个1和8个0。B类网络的掩码前面有16个1,子网号subnet-id用了8个1,因此掩码有 24个1和8个 0。
2024-02-19 16:11:10 973
原创 计算机网络(第四章)
网际协议 IP是 TCP / IP 体系中最主要的协议之一。地址解析协议 ARP(Address Resolution Protocol)逆地址解析协议 RARP (Reverse Address Resolution Protocol)网际控制报文协议 ICMP (Internet Control Message Protocol)网际组管理协议 IGMP (Internet Group Management Protocol)
2024-02-16 12:03:26 2621
原创 计算机网络第三章习题(谢希仁)
如果数据链路层不是做成可靠的链路层,那么当网络中的某个结点发现收到的帧有差错时(不管数据链路层是否做成是可靠的,这个检查差错的步骤总是要有的),就仅仅丢弃有差错的帧,而并不通知发送结点重传出现差错的帧。数据链路连接具有检测、确认和重传功能,使不可靠的物理链路变为可靠的物理链路,进行可靠的数据传输,当数据链路断开时,物理链路不一定跟着断开。数据链路层在收到数据时,就无法知道对方传送的数据中哪些是数据,哪些是信息,甚至数据中有没有差错也不清楚(因为无法进行差错检测)。数据链路:在链路的基础的上,
2024-01-25 11:41:50 1978 1
原创 滑动窗口(双指针的应用)
给你一个整数数组 nums 和一个整数 k ,判断数组中是否存在两个 不同的索引 i 和 j ,满足 nums[i] == nums[j] 且 abs(i - j)
2024-01-24 21:11:54 638
原创 算法实战(数组篇)
给你一个 非严格递增排列 的数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 ,返回删除后数组的新长度。更改数组 nums ,使 nums 的前 k 个元素包含唯一元素,并按照它们最初在 nums 中出现的顺序排列。nums 的其余元素与 nums 的大小不重要。给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素,并返回移除后数组的新长度。不要使用额外的数组空间,你必须仅使用 O(1) 额外空间并 原地 修改输入数组。元素的顺序可以改变。
2024-01-20 15:38:44 488
原创 C语言常见关键字
在全局变量前面加上关键字static,该全局变量变成了全局静态变量。全局静态变量有以下特点。a.在全局区分配内存。b.如果没有初始化,其默认值为0.c.该变量在本文件内从定义开始到文件结束可见。该变量在全局数据区分配内存。它始终驻留在全局数据区,直到程序运行结束。其作用域为局部作用域,当定义它的函数或语句块结束时,其作用域随之结束。用static定义的全局和局部静态变量的区别是,全局的静态变量的作用域和可见域都是从文件的定义开始到整个文件结束;
2024-01-20 12:13:17 433
原创 计算机网络第三章(谢希仁)
数据链路(data link) 除了物理线路外,还必须有通信协议来控制这些数据的传输。帧没有发送完,如果发送端出了问题,只能重发该帧。传输过程中,可能会出现错误,其中把一段时间内,传输错误的比特所传输比特总数的比率称为误码率。就是加上帧开始、帧结束的标记,知道那块是开始,那块是结束,确定了帧的界限。· 现最常用的方法是使用适配器(即网卡)来实现这些协议的硬件和软件。帧头 帧尾的标识符, 数据部分可能会出现帧头、帧尾的标识符。答:收到之后,会全部扔了,当做无效帧而丢弃。一条链路只是一条通路的一个组成部分。
2024-01-18 11:56:31 412
原创 算法常用思路总结
把数组中下标为0的值,先设置为最大(最小值),然后遍历数组,如果比它大(小)就更新。通过不断的模以10,然后再除以10,不断循环,使用递归,把大问题分解为小问题。
2024-01-18 11:55:55 442
原创 算法实战(五)
将N个整数按从小到大排序的冒泡排序法是这样工作的:从头到尾比较相邻两个元素,如果前面的元素大于其紧随的后面元素,则交换它们。通过一遍扫描,则最后一个元素必定是最大的元素。依此类推,最后只需处理两个元素,就完成了对N个数的排序。输入在第1行中给出N和K(1≤K
2024-01-14 17:55:54 384 1
原创 计算机网络第二章(谢希仁)
由于历史上的原因,PCM 有两个互不兼容的国际标准,即北美的 24路 PCM (简称为 T1)和欧洲的 30 路 PCM(简称为 E1)。光缆,又称光纤缆线,是由一束光纤组成的集合体,它不仅包括光纤本身,还包括用于保护光纤的外层结构,如塑料护套等。简而言之,光纤是光缆的组成部分,而光缆是光纤的集合体。在任何的信道中,码元的传输速率都是有上限的,到达一定程度的话,会出现码间串扰的现象,最后识别不出来。分为时间段进行传送数据,接收的时间按照顺序取出,用户多的话,给每个人分的时间就会变少,速度就会变慢。
2024-01-14 12:50:47 1375 1
原创 算法实战(四)
乌龟与兔子进行赛跑,跑场是一个矩型跑道,跑道边可以随地进行休息。乌龟每分钟可以前进3米,兔子每分钟前进9米;兔子嫌乌龟跑得慢,觉得肯定能跑赢乌龟,于是,每跑10分钟回头看一下乌龟,若发现自己超过乌龟,就在路边休息,每次休息30分钟,否则继续跑10分钟;而乌龟非常努力,一直跑,不休息。假定乌龟与兔子在同一起点同一时刻开始起跑,请问T分钟后乌龟和兔子谁跑得快?后跟1空格,再输出胜利者跑完的距离。输入在一行中给出比赛时间T(分钟)。在一行中输出比赛的结果:乌龟赢输出@
2024-01-13 11:41:39 416 1
原创 mybatis入门(二)
Data : 注解在类上, 为类提供读写属性, 此外还提供了 equals()、hashCode()、toString() 方法。@AllArgsConstructor在类上使用,这个注解可以生成全参构造函数,且默认不生成无参构造函数。@NoArgsConstructor在类上使用,这个注解可以生成无参构造方法。
2024-01-12 23:01:53 333
原创 Springboot整合mybatis
3、搜索mybatis 找到springboot整合mybatis的包。1、剔除mybaits的包在pom.xml。5、mybatis.xml删除。6、删除utils包。
2024-01-12 23:01:20 389
原创 计算机网络必考大题
TCP / IP 五层协议或OSI七层参考模型CRC校验码(也称为冗余检验码)1、根据生成多项式P(x)确定除数;2、给生成多项式的P(x)的最高阶补0;3、给信息位(补0后)与除数做异或运算,得到余数。4、得到的余数补全位数,放在原信息位后。例如:1、数据链路层要发送的数据为10100101,采用CRC的生成多项式是P(x)= x8+x6+1,应添加在数据后面的校验码是位数是多少?解:答:应该是8位,因为是根据生成多项式的最高位来看, 最高项是几,就补几个0。2、首先你要知
2024-01-11 14:10:14 532
原创 路由器实验总结(静态路由配置)
1、静态路由的配置R2(config)#int s0/0/0R2(config)#ip add 192.168.3.2 255.255.255.0R2(config)# no shutR1(config)#int s0/0/0R1(config)#ip add 192.168.3.1 255.255.255.0R1(config)# no shut串口的配置是这样的,静态路由如下:R2(config)#ip route 192.168.4.0 255.255.255.0 192.168.
2024-01-11 13:55:19 738
原创 Linux网络编程
例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考。
2024-01-11 13:54:00 870
原创 Qt网络编程
事件先一直在那个a.exec();然后又事件过来,打断,过去进行处理,处理完又返回现场,相当于一个多重中断先要创建过滤器然后再按照过滤器过滤器的创建还是有点问题3、容器类QWidgetQFrame4、编辑类QComboBoxQLineEditQTextEdit5、显示类QLabelQLcdNumber2)、布局水平、网格布局属性大小策略 固定最小大小 、最大大小弹簧3)、自定义控件(提升)4)、常用事件处理。
2024-01-11 13:51:40 404
原创 算法实战(三)
首先顺序输出从A到B的所有整数,每5个数字占一行,每个数字占5个字符宽度,向右对齐。最后在一行中按Sum = X的格式输出全部数字的和X。三个球A、B、C,大小形状相同且其中有一个球与其他球重量不同。要求找出这个不一样的球。输入在一行中给出2个整数A和B,其中−100≤A≤B≤100,其间以空格分隔。给定两个整数A和B,输出从A到B的所有整数以及这些数的和。输入在一行中给出3个正整数,顺序对应球A、B、C的重量。注意:没有必要用数组进行存储数据,这样的话更不好判断。在一行中输出唯一的那个不一样的球。
2024-01-11 13:43:15 476 1
原创 算法实战(二)
读入两个数字,第一个数字以这样的四位数字表示当前时间,第二个数字表示分钟数,计算当前时间经过那么多分钟后是几点,结果也表示为四位数字。输入在一行中给出 2 个整数,分别是四位数字表示的起始时间、以及流逝的分钟数,其间以空格分隔。注意:在起始时间中,当小时为个位数时,没有前导的零,即 5 点 30 分表示为 530;本题要求编写程序,顺序读入浮点数1、整数、字符、浮点数2,再按照字符、整数、浮点数1、浮点数2的顺序输出。输出不多于四位数字表示的终止时间,当小时为个位数时,没有前导的零。
2024-01-10 15:34:36 941 1
伴随着疫情的到来,学校为了解在校师生的健康状况,全校师生都规定在特定的时间进行健康打卡或校内打卡,本项目有助于学生实现打卡
2023-05-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人