自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(891)
  • 资源 (3094)
  • 收藏
  • 关注

原创 基于QT(C++)实现线性表节点的存储结构综合应用设计

在这次课程设计中,我主要完成了两款软件。一款能够模拟哈希表的建立、删除、新增、查找操作。一款能够模拟线性表转为树形结构的操作。在实践过程中,我复习了哈希表的各种哈希函数的选取和冲突的解决方法;哈希表的建立、查找、插入和删除操作。我通过查阅资料,分析选取了较好的线性表转树形结构的数据结构和方法。还有就是自学了 QT,了解掌握了 QT 的基本信号与槽的原理,以及部分关键控件如 QTreeWidget、QTableWidget 等的操作。这是我第一次自己动手完成一款软件。在一开始选取平台的时候我纠结了很久。

2026-05-07 10:31:03 171

原创 基于 Swift 设计的换乘指南打印系统

操作系统:macOS Mojave 10.14.6编程语:Swift 5.1开发框架:SwiftUI编译器:Apple SwiftIDE:Xcode Version 11.0 beta 6 (11M392R) 运行环境。上述环境可以构建并运该 app,通过 Xcode Simulator。可以模拟出各种Apple 设备。其它 macOS 环境下能否直接运可执程序 simulator 未知。发版 iOS 13、发版 Xcode 11 放出后可以直接 build 到 iPhone、iPad 上。

2026-05-07 10:30:22 45

原创 基于C#实现的哈夫曼转化软件

最后根据字符在哈夫曼树中的位置,进行相应的 0、1 编码,这样每个字符都会获得自己的一个独有的编码,最后按照字符串中字符的顺序依次输出编码,初始想法是这样。利用 Visual Studio C# .Net Framework 集成开发环境,先设计好整体页面,将各组件布置到位,然后依次完成输入、控制、运行(数据插入数组,排序,插入树节点,输出哈弗曼编码)以及其他的一些操作的逻辑构建,代码编写,逐步调试,如果出现错误,则通过加入断点,判断出错位置,进行修正。考虑了没有输入文本就开始运行等状况,容错性良好。

2026-05-06 11:14:45 339

原创 基于C# 利用工程活动图 AOE 网设计算法

复习数据结构课程中所学的知识点,重点复习哈夫曼树构造算法、关键活动计算方法以及树和图的存储形式学习 C#基本语法学习 C# winform 窗体基本构建,各个控件的特性,使用方法设计程序用到的数据结构及选择相应合适的.Net Framework 窗体控件构建窗体,完善各个部件的具体功能通过参考书籍和网络资料解决问题,不断改进,提高容错性和用户体验总结复盘,回顾反思。

2026-05-06 11:13:55 202

原创 基于 C++实现人工智能课程五子棋博弈问题

熟悉和掌握博弈树的启发式搜索过程、α-β 剪枝算法和评价函数,并利用 α-β 剪枝算法开发一个五子棋人机博弈游戏。问题 1: 主要难点在局面分数评估以及基于极大极小搜索的阿尔法贝塔剪枝算法的设计,这是与电脑棋力以及电脑落子速度紧密关联的地方,评估函数的打分直接影响到电脑落子的偏好,剪枝节点的顺序以及层数影响到剪枝效率,这些都是需要考虑的地方。解决方案:通过查找文献资料深入了解 alpha-beta 搜索算法后得以解决问题 2:图形化时,获取鼠标动作的时间用一个标志位控制;

2026-04-29 09:29:05 618

原创 基于 C++ 语言实现 A算法的求解八数码问题的程序

熟悉和掌握启发式搜索的定义、估价函数和算法过程,并利用 A*算法求解 8 数码难题,理解求解流程和搜索顺序。存在的问题:算法部分中对于寻找每次从 Open 表中取出的结点在搜索树中的位置一开始采用的是先序遍历搜索树查找结点的方法。该方法一定能找到结点的位置,但在搜索树规模较大的情况下会消耗大量的时间,甚至会超过算法其它重要部分运行的时间很多。解决方案:在先序遍历的基础上添加深度限制。通过读取结点的 g(n)信息即可确定结点所在的深度,从而在遍历中不去遍历层次更深的结点,降低了时间消耗。

2026-04-29 09:28:27 383

原创 基于 Python 实现 BERT 的情感分析模型

例如,当我们看图片时,我们的注意力肯定会集中在某个部分, 随着眼睛的移动,注意力又转移到图片的另一个部分。当我们补 0 时,在进行 self-attention 操作时,我们是希望补的 0 不参与运算的,所以其中 input_mask 的作用就是表示长度为 128 的数据之中有多少个数据是用有用的,补的 0 对应的 input_mask 就是 0,是不参与运算的。使用传统的 Word2vec 产生的词表示是静态的,不考虑上下文的,如果对两个 it 进行向量化表示,得到的词向量是一样的,这显然是有瑕疵的。

2026-04-28 10:18:36 388

原创 基于Python实现上下消化道病历分类

读取train or val or test文件,遍历每条,每条的每个字都会计算出一个score值,0 ≤ socre ≤ 1,然后设置一个门限值,将score大于该门限值的字,或多个字连在一起组成的词抽取出来,放入一个数组,最后统计该字or词出现的frequency,排序。参数量为bert_base的十分之一,模型大小也十分之一;使用warmup调整学习率,0~1000步时,学习率从0线性增加到1e-4,然后1000~2000步时,学习率从1e-3线性下降到1e-5,2000步后学习率保持1e-5不变。

2026-04-28 10:14:13 280

原创 基于GAN的恶意软件对抗样本生成

软件对抗样本的约束性。

2026-04-27 10:04:04 240

原创 基于Python(Django)+MySQL 实现(Web)SQL智能检测系统的设计与实现

随着近年来移动通信技术不断发展和智能手机普及度的不断提高,移动端通信业务的用户数量和通信流量大大增加,移动通信的市场竞争非常激烈。为了扩大市场份额和更好的服务用户,中国移动的套餐业务更新频繁,每个月新上线的套餐数量都可以达到 20 左右,春节前后和暑假期间属于套餐更新的高峰,数量甚至可以超过 50 个。

2026-04-27 10:03:25 576

原创 基于Python实现(控制台)个人信息系统

目的是通过课程设计的综合训练,培养学生实际分析问题、解决问题的能力,以及编程和动手能力,最终目标是通过课程设计这种形式,帮助学生系统掌握Python这门课程的主要内容,养成良好的编程习惯,更好的完成教学任务。本次课设,让我明白了纸上得来终觉浅,只是听听不动手实践时学不会编程的,这虽然是一个非常简单的课设,但是我在刚开始写程序时,由于马虎却出现了不少的错误,导致我检查了许多次,才发现错误。People一个类,存储了学生的姓名,性别,专业,学历,兴趣,爱好等各个属性,为后续的处理提供了方便。

2026-04-24 08:36:12 345

原创 基于Python实现(控制台)成绩统计系统

目的是通过课程设计的综合训练,培养学生实际分析问题、解决问题的能力,以及编程和动手能力,最终目标是通过课程设计这种形式,帮助学生系统掌握Python这门课程的主要内容,养成良好的编程习惯,更好的完成教学任务。通过本次实验,我有一个惨痛的教训,就是不能等到把全部程序写完再调试,必须写一部分就调试一部分,如果把全部程序写完再调试会发生许多的错误,再以后的编程实践中,我们应该写一个函数或者是一个模块,然后进行调试,调试成功后再继续进行写程序。函数 Clac 统计每个分数段的学生的人数占所有人数的百分比。

2026-04-24 08:33:36 331

原创 基于C++实现的(控制台)员工工资管理系统

All.h与2.3中的代码一致。5.1 自我评价及收获要求:针对本人选择的课程设计题目,列出本人已经完成的项目,并对每项完成的任务进行自我评价,写出感想。在此基础上,还可对整个系统进行评价。(不小于200字)这个C++的课程设计用了大概一周左右的时间完成,在一开始是毫无头绪地在瞎打。由于没有一个明确的思路,不像学期初那个C语言的项目有明确的思路。

2026-04-23 09:07:17 525

原创 基于python实现的(窗体)家族信息管理系统

图2-1为我们的家谱管理系统的模块设计。ais用以保存家谱个人结点的基本信息以及相关函数操作。uis模块存放登录界面以及主页面的UI设计文件以及相应的信号功能。用familytreeapp.py文件将ais,uis中的主要功能进行封装。main.py文件里面进行familiytreeapp程序文件运行以及读写json文件功能。最后为了方便用户操作,我们创建bat文件进行程序的运行。运用模块化的思想编写程序使得程序寻找bug维护显得较为轻松。图2-1 项目模块图。

2026-04-23 09:04:42 808

原创 基于C语言实现的通用寄存器实验

2-4 译码器的输入 sel[1..0]接 DR[1..0],2-4 译码器对 2 位的输入信号 sel[1..0]进行 2-4 译码,产生 4 个输出 sel00、sel01、sel10、sel11,分别送往 4 个寄存器 R0、R1、 R2、R3 的选择端 sel。在用VHDL设计的系统中,层次化设计的概念和原理图层次化设计的概念相似,即在较高层设计中引用低层的或外部的元件。层次结构的设计方法是把一个大的系统划分为若干子系统,顶层描述各子系统的接口条件和各子系统之间的关系。(3)DR端口为读写端口。

2026-04-22 09:14:28 402

原创 基于XCode IOS开发系统实现的新闻APP

它有着启动界面、登录界面,在输入正确的账号密码后方可进入新闻界面。同时还具备搜索功能,用户输入关键字,相应的新闻即可跳出。图2-5 项目目录关于登录界面部分,UserViewController定义了偏好设置,登陆界面控件的功能以及登录功能。

2026-04-22 09:13:25 363

原创 基于Java实现的ping项目

本课程设计的优点是界面简洁,功能简单易懂;不足之处是Linux运行用不了,因为Linux上的命令行ping出的结果与windows的显示不一样。课程设计是培养学生综合运用所学知识,发现、提出、分析和解决实际问题,锻炼实践能力的重要环节,是对学生实际工作能力的具体训练和考察过程。随着科学技术发展的日新日异,当今计算机应用在生活中可以说得是无处不在,我们要多实践多动手,才能跟上知识的更新速度。此次课程设计让我收获良多。

2026-04-21 09:08:26 399

原创 基于 MATLAB 实现的二值图像中的信息隐藏

使用 MATLAB 实现了第二种方法,即 2.2. 中的利用游程编码的方法,用 decode.m 实现秘密信息嵌入,用 encode.m 实现秘密信息提取,嵌入时用到了 str2bit 和 Vector2Matrix 两个函数做待隐藏信息的编码处理,提取时用到了 bit2str 函数解码比特串为正常字符串。待隐藏信息保存在 隐藏信息.txt 中,取出信息编码为二进制比特串才能进行隐藏。提取与隐藏类似,但只需要对隐藏信息的载体图片的游程进行统计以获得相应的二进制比特串,之后再解码为正常的字符串即可。

2026-04-21 09:07:39 381

原创 基于 MATLAB 实现的 DCT 域的信息隐藏

使用 MATLAB 实现了第三个算法,即 2.3. 中的利用利用载体中两个特定数的相对大小来代表隐藏信息的方法,不需要原始载体的信息,用 decode.m 实现秘密信息嵌入,用 encode.m 实现秘密信息提取,字符串处理的函数与上一个实验使用的是一样的,目的是将字符串编码为二进制比特流,或者将二进制比特流解码为字符串。对图像进行 DCT 变换,比较每一块相应三个位置的系数,从它们之间的关系,可以判断隐藏的是信息“1”、“0”还是“无效”块,这样就可以恢复秘密信息。应选择相近的值(如中频系数)。

2026-04-20 08:53:43 690

原创 基于C++实现的九连环递归算法及其拓展

九连环是中国最杰出的益智游戏。长期以来,这个益智游戏是数学家及现代的电子计算机专家们用于教学研究的课题和例子。九连环以金属丝制成9个圆环,将圆环套装在横板或各式框架上,并贯以环柄。把玩时,按照一定的程序反复操作,可使9个圆环分别解开,或合二为一。从完整状态解下所有九个环一般需要解341步。

2026-04-20 08:52:35 380

原创 基于C++实现的简单的网络应用程序

实现客户端只需要一个继承自CAsyncSocket的类,假设叫CConnectSocket,需要重载OnConnect OnSend OnReceive OnClose. OnConnect主要是为了收到接通时的事件,处理errorcode,其他跟服务器类似。首先打开客户端和服务器界面,点击服务器监听,客户端连接(直接点击连接即可,默认IP为本机,端口号1088)后建立连接,发送请求,服务器返回请求,客户端接收,关闭连接,下次发送请求需要重新连接。)客户端发送请求,服务器响应,客户端接收。

2026-04-17 09:06:44 164

原创 基于C语言实现的web服务器

(1)建立.cpp文件,引用头文件winsock2.h,利用SOCKET创建套接字,bind绑定端口,listen监听请求,accept接受请求,接受请求后用thread实现多线程,实现多用户并发访问,出现一个请求就创建一个线程返回请求。在获得了要请求网页所在主机的IP后,本地PC将作为客户机向服务器发起TCP连接请求,连接请求建立成功后,客户机即可向服务器返回确认,这就是俗称的“三次握手”过程。(6)待捕获一段时间,关闭浏览器,选择主窗口中有的“stop”按钮,可以停止分组的捕获。

2026-04-17 09:05:52 163

原创 基于C++实现的简单的SMTP服务器

客户端向服务器发送用户登录命令AUTH LOGIN,服务器回复的两个334分别表示用户名和密码,之后客户端分别向服务器发送编码后的用户名和密码(SMTP要求用户名和密码都通过64位编码后再发送,不接受明文),服务器分别回复235表示身份验证成功。因为SMTP协议是基于TCP的,所以先进行三次握手,客户端与服务器建立TCP连接,服务器返回连接信息,表示是否连接成功(S: 220 smtp-2.qy.internal ESMTP ready服务器发送220表示已经准备就绪)。双方断开连接,通信过程结束。

2026-04-16 09:46:17 509

原创 基于 MATLAB 实现的可视密码图示法设计

1994年,由M.Naor和A.Shamir提出,其思想是把要隐藏的密钥信息通过算法隐藏到两个或多个子密钥图片中,每一张图片上都有随机分布的黑点和白点,把所有的图片叠加在一起,则能恢复出原有的信息。主要特点:恢复秘密图像时不需要任何复杂的计算,直接以人的视觉系统就可以将秘密图像辨识出来。

2026-04-16 09:44:02 246

原创 基于 MATLAB 实现 Word 的信息隐藏算法

Microsoft Word是当今全世界使用最普遍的文字处理软件。Word给人们的日常办公和文字编辑带来了极大的便捷。随着网络和通信的发展,Word作为电子文档的标准格式之一,在各种基于Web的系统中应用非常广泛。Microsoft Word的存储格式随着它的新版本的变化而变化,而Microsoft公司并不对外公开Word文档的存储格式;Word文档的文字、图片、表格等显示信息通过自己的CSS来描述,而且有自己自定义的命名空间;Word文档是一种以字符信息和格式信息为主要内容的具有多种信息的文件;

2026-04-15 09:21:52 420

原创 基于 MATLAB 实现的流载体的LSB隐藏项目

由于嵌入信息时是一小块为一个整体,所以提取时也同样要这样做,由于图片在传输或者保存过程中可能会有一些改变,所以计算每个小块内隐藏信息的阈值,如果一半以上为1则这个小块隐藏的信息为1否则为0。如果只把信息保存在一个像素中很容易丢失,所以根据信息长度与载体图片的长度划分小块,以一个小块存储一位信息,能大大增加信息隐藏的健壮性。在调用嵌入函数之前,需要保证载体图片为灰度图片,如果载体图片不足以隐藏秘密信息,则人为把载体图片扩充以隐藏,以保证信息的正常嵌入。调用提取函数,获得秘密信息。

2026-04-15 09:21:10 410

原创 基于 MATLAB 实现的图像信号处理

PSNR (Peak Signal to Noise Ratio) 峰值信噪比PSNR衡量图像失真或是噪声水平的客观标准。2个图像之间PSNR值越大,则越相似。普遍基准为30dB,30dB以下的图像劣化较为明显。定义为,这里MAX表示图像颜色的最大数值,8bit图像取值为255。

2026-04-14 09:17:42 1050

原创 基于C++实现的记分板调度方法仿真

计分板数据结构是整个实验的核心,而实验要求可视化的计分板流程,所以我把计分板上所有需要用到的数据都存储在面板上,也就是实体可视化的数据结构。如需使用其中数据,则直接从面板获取即可,如果修改了数据也及时更新到面板上。另外,跟上一个实验一样,我同样是用了两套计分板,表示开始和结束两个状态,第二个计分板是隐藏的不可见,从设计图中可以看到.读取是从第一个计分板,更改放到第二个计分板上,这样避免了模拟过程中发生数据冒险和结构冒险(人为)。

2026-04-14 09:16:50 373

原创 基于C++实现的指令流水仿真程序

/ 模拟各段之间的锁存器// IF/IDpublic:CString PC;CString IR;CString IR;int A;int B;int C;int Imm;CString IR;int C;int Imm;CString IR;

2026-04-13 10:34:37 194

原创 基于C++实现的(控制台)密码算法设计

对密文字母 y 先减 b,再不断加 26,直到找到一个数 x 使得 y=a*x, 则 x 即为明文字母对应的数字。输入密钥长度 m 以及密钥,对明文以 m 为单位分组,每组明文字母与对应密钥在模 26 的域内相加得到密文。以 m 为单位分组,每组密文在模 26 域内减去对应密钥再加 26(保证得到的数是非负数),即可得到明文。将凯撒密码、维吉尼亚密码以及仿射密码结合起来,先后经历三次加密, 扩大密钥空间,难以解密。输入加密参数 a,b,对每一个明文字母 x 在模 26 域内进行 y=a*x+b。

2026-04-13 10:33:59 641

原创 100010671-基于C++实现的(控制台)景区管理系统

首先对DFS、迪杰斯特拉、Prim算法都再次深入理解了一遍,而且能更加熟练的运用和修改后适用于新问题,同时也对算法的利弊有所体会。再一个就是学会了使用文件的读取和读写流,文件数据修改后应该重新写入文件,以及重新创建相应的图。这个过程中,一个很重要的问题还是指针的熟练掌握和运用,对于所创建的数据结构必要时要在数据的末尾指针赋空,这样检索遍历时不会混乱。在刚开始程序写完运行的时候很容易出现烫烫烫,就是因为传值没有传过来,数据没有初始化等原因。

2026-04-10 14:24:16 368

原创 100010670-基于Java Web + MySQL实现的(Web)网上订餐系统

随着信息化技术在生活中的应用越来越广泛, 网上订餐也逐渐成为人们的一种生活方式这类订餐软件在市面上也很多。本系统正是基于这样一种环境下应运而生。本系统主要实现用户的网上订餐业务流程、用户注册、用户资料修改和管理员实现添加菜品相关信息,修改推销广告等。本系统主要利用原生的 servlet 技术进行开发,有很强的逻辑性、可扩展性, 便于维护。用户界面设计主要实用了 CSS,美化了页面。其次本系统设计还使用 了 JSP技术、 JDBC技术、 JavaBean 技术、filter过滤器技术和MVC开发模式。二、

2026-04-10 14:22:15 479

原创 基于C++实现的题宽带直流程控放大器

方案二: 为了易于实现发挥部分中要求的最大 60dB 的增益调节,本着优质低价的原则,可以采用较为廉价的 D/A 芯片 DAC0832,利用 DAC0832 当中的电阻 T 型网络改变反馈电压,进而控制环路增益。本方案由于采用分立元件较多,而且必须采用高速 BJT 或 FET,电路较为复杂,设计难度大,工作点难于调整,增益的定量调节、AGC 自动增益控制和高带宽均非常困难,而且电路稳定性差,容易产生自激现象,不可控因素较多,调试难度大,故不予考虑。由于AD603 的输入阻抗为 100 欧姆,满足题目要求。

2026-04-09 11:25:08 360

原创 基于Java Web + MySQL实现的(Web)手机商城系统

Eclipse是一个基于开放源码的Java的规模化开发平台。这只是一个框架和一套服务来创建一个包含组件的开发环境。Eclipse是一个基于开放源代码的Java扩展开发平台。就其本身而言,它只是一个基础设施和一套服务,以创建一个包含组件的开发环境。这是迄今为止最受欢迎的Java编程工具。对于开放源平台,任何人都可以下载源代码eclipse,并开发自己的基于此功能的插件。此外,eclipse提供了强大的代码支持功能,可以帮助软件开发人员确保自动添加代码,API请求,代码修改等一个功能,可以提高代码写作的效率。

2026-04-09 11:24:28 612

原创 基于C++实现的(控制台)酒店管理系统

void Denglu()//登录Admin():Base_admin() {};//构造函数void Register_Reception()//用于注册前台void set_VIP()//制定vip优惠政策void set_ROOM()//指定各个房间的类型void set_DAY()//指定入住多少天有多少优惠void setdate()//指定今天是几月几号void service()//面向管理员的服务,调用上述函数。//用户预定的房间号 int is_ever_booked;

2026-04-08 10:49:11 386

原创 基于Python实现的人脸识别系统

本实验使用的是交叉熵损失函数,这个函数在分类任务上比较常用。定义了一个损失函数后,还有对它求平均值,因为定义的是一个Batch的损失值,同时我们还可以定义一个准确率函数,这个可以在我们训练的时候输出分类的准确率。

2026-04-08 10:48:26 382

原创 基于QT(C++)+Oracle实现的(界面)教务管理系统

这次数据库大作业,让我更加清楚地认识到了数据库的重要性。大二上学期,我们也做过一个类似的系统,但是我们当时对数据操作都是以文本文件或者二进制文件来存储的,读取起来真的非常的慢。而且当时我们为了求出某一项数据,还必须要将很多个文件连接起来,而这些文件又放在不同的目录里面,所以我们要查找一个文件还要先查找目录名。

2026-04-07 11:14:10 942

原创 基于QT(C++)实现(界面)实现的五子棋游戏

/ 游戏类型,双人还是AI(目前固定让AI下黑子)PERSON,BOT// 游戏状态PLAYING,WIN,DEAD// 棋盘尺寸public:public:// 存储当前游戏棋盘和棋子的情况,空白为0,白子1,黑子-1// 存储各个点位的评分情况,作为AI下棋依据// 标示下棋方// 游戏模式// 游戏状态// 开始游戏// 计算评分// 人执行下棋// 机器执行下棋// 每次落子后更新游戏棋盘// 判断游戏是否胜利// 判断是否和棋。

2026-04-07 11:03:22 255

原创 基于C++实现亚马逊棋

若不是测试模式,则直接更新棋盘数组并更新当前显示画面。否则又分为两种情况,若是评估使用,则更新测试数组,否则其功能是判定棋子是否在棋盘内。算法的基本思路是贪心算法,也就是计算当前局面每一个可行解下过之后本方步数与对方步数之差,选出这个差值最大的解输出。鼠标点击一下并释放,则显示棋子的可行域。否则显示障碍物的可行域。释放障碍物之后,算法执行,AI 下棋。开始新游戏时,把之前的存档删除,并清除所有数据。若点击的地方不是可行域,则无效,需要重新选择棋子下棋。清除所有数据,初始化回合数,黑白方步数和棋盘数组。

2026-04-03 10:56:54 227

原创 基于C#+SqlServer实现(WinForm)学生信息管理系统

6.1 使用 treeview 实现点击不同的选项,在右侧面板中显示不同的界面。

2026-04-03 10:56:11 317

100013367-个人简单操作系统的实现与设计

本项目是基于Intel x86 架构的简易个人操作系统开发实践,以 Linux 0.12 与《30 天自制操作系统》为参考,聚焦内核核心功能验证。项目实现进程管理、多任务处理、系统库构建,支持键盘、鼠标、显示器等外设交互,并完成命令行交互界面。开发基于 Ubuntu 环境,采用 NASM 汇编、GCC 编译与 Make 工具管理,在 Bochs 模拟器中运行。通过引导程序加载、实模式转保护模式、内存与中断管理等关键模块,验证操作系统底层运行原理,同时将软件工程方法融入小型系统开发,帮助理解内核本质与硬件交互逻辑。

2026-04-29

大学生就业调查问卷数据集(10列,10000条记录)CSV

包含字段:ID、性别、专业、学历、毕业去向、就业行业、期望薪资、工作城市、满意度评分、是否有实习经历。

2026-04-29

社交电商数据集(32字段,100000条记录)CSV

本数据集包含100,000条社交电商用户购买行为记录,涵盖31个特征变量和1个二分类目标变量(是否购买)。小红书、抖音等社交电商平台的真实场景,包含用户特征(年龄、性别、等级等10个)、内容特征(价格、折扣、类目等7个)、社交特征(点赞、评论、分享等6个)、行为序列特征(加购、用券、浏览等5个)以及4个衍生特征(互动率、购买意向等)。数据集正负样本比例约为1:4,用户以年轻女性为主(平均年龄27岁,女性占比63.8%),价格和互动数据呈右偏分布,符合社交电商的典型特征,适用于购买转化预测、推荐系统优化、用户行为分析等机器学习任务。 变量名称 类型 说明 user_id 字符串 用户唯一标识 item_id 字符串 商品唯一标识 age 整数 用户年龄(18-65) gender 整数 性别(0=女,1=男) user_level 整数 用户等级(1-7) purchase_freq 整数 近30天购买次数 total_spend 浮点 累计消费金额(元) register_days 整数 注册天数 follow_num 整数 关注数 fans_num 整数 粉丝数 price 浮点 商品价格(元) discount_rate 浮点 折扣率(0-1) category 字符串 商品类目 title_length 整数 标题字符数 title_emo_score 浮点 标题情感得分(0-1) img_count 整数 图片数量 has_video 整数 是否有视频(0/1) like_num 整数 点赞数 comment_num 整数 评论数 share_num 整数 分享数 collect_num 整数 收藏数 is_follow_author 整数 是否关注作者(0/1) add2cart 整数 是否加购(0/1) coupon_received 整数 是否领券(0/1) coupon_used 整数 是否用券(0/1) pv_count 整数 近7天浏览次数 last_click_gap 浮点 距上次点击小时数 interaction_rate 浮点 互动率(衍生) purchase_intent 浮点 购买意向强度(衍生) freshness_score 浮点 时间新鲜度(衍生) social_influence 浮点 社交影响力(衍生) label 整数 是否购买(0/1,目标变量)

2026-04-29

某大学学生成绩情况数据集(10列,1000条记录)XLSX

包含字段:学号、班级、性别、平时作业平均分、测验平均分、出勤率、平时成绩、期末考试成绩、总评成绩、总评等级。 字段名, 数据类型, 描述 学号, 字符串 (object), 学生唯一编号,由年级 + 学院代码 + 三位院内流水号组成 班级, 字符串 (object), 学生所在班级名称,格式如“2024级计算机科学与技术1班” 性别, 字符串 (object), 学生性别,取值为“男”或“女” 平时作业平均分, 浮点型 (float64), 学生平时作业成绩的平均分,范围通常为 0–100 测验平均分, 浮点型 (float64), 学生日常测验成绩的平均分,范围通常为 0–100 出勤率, 浮点型 (float64), 学生课程出勤表现换算后的分值,范围通常为 0–100 平时成绩, 浮点型 (float64), 由平时作业平均分、测验平均分和出勤率加权计算得到,计算公式为:平时作业平均分 × 0.35 + 测验平均分 × 0.35 + 出勤率 × 0.30 期末考试成绩, 整数型 (int64), 学生期末考试成绩,为整数分 总评成绩, 浮点型 (float64), 学生课程总评成绩,由平时成绩和期末考试成绩加权计算得到 总评等级, 字符串 (object), 根据总评成绩划分的等级,取值为“优秀”“良好”“中等”“及格”“不及格”

2026-04-29

图像分类数据集(50类,1300张图像)JPEG

图像分类数据集,聚焦 50 个常见类别,覆盖动物、交通工具、家电、果蔬等多个生活及自然领域。该数据集配套完整的处理脚本与类别映射文件,可快速完成数据复制、拆分、尺寸标准化等预处理流程,最终输出结构规整的训练集、测试集、验证集,适用于图像分类算法研发、模型训练与性能验证等计算机视觉任务。 总计 50 个类别,按属性划分为 10 个组别,每组 5 个类别: 第 1 组:宠物犬类 第 2 组:工作犬类 第 3 组:猫科动物 第 4 组:鸟类 第 5 组:水生动物 第 6 组:陆地野生动物 第 7 组:昆虫与节肢动物 第 8 组:常见交通工具 第 9 组:日常家电 第 10 组:常见果蔬食物 总类别数:50 个 图像尺寸:统一为 224×224 像素 数据分布(按子集): 训练集:每个类别 1000 张,总计 50×1000 = 50000 张 测试集:每个类别 150 张,总计 50×150 = 7500 张 验证集:每个类别 150 张,总计 50×150 = 7500 张

2026-04-29

2024–2025 慕课课程多维画像与学习行为数据集(2文件)xls

本数据集来源于国内多所高校在公开慕课平台上发布的课程元数据及配套教学行为明细的抽样整理,已在脱敏与聚合处理中去除可直接识别个人身份的信息,仅保留课程编号、学校与院系层级标识、教师公开署名、选课规模、开课周期等字段,以及学习者匿名 ID、会话标识、行为类型(如视频学习、测验提交、作业提交、讨论浏览、资源下载、课程评价等)、章节与资源编码、发生时间、学习时长、进度变化、测验与作业得分及是否通过、终端与网络环境、满意度评分等,用于支撑学习投入度分析、过程性评价、课程质量监测与教学改进研究。

2026-04-29

淘宝用户消费综合数据集(6文件,用户、商品、行为、订单)CSV

淘宝用户消费数据汇总,包括: 用户基本信息 商品信息 用户行为数据 订单数据 用户特征(随机森林用) 商品特征 注: 用户行为数据 :包含浏览、点击、收藏、加购四种行为 订单状态 :模拟了完整的订单生命周期(待付款→已付款→已发货→已收货→已完成) 复购标签 : repurchase_indicator 可直接作为随机森林分类目标变量 购买意向 : purchase_intent 可作为回归目标进行预测

2026-04-29

电商运营分析场景的多平台模拟数据集(10文件)CSV

该数据集是一个面向电商运营分析场景的多平台模拟数据集,可理解为淘宝、京东、抖音等平台业务流程在教学环境中的抽象与映射,数据内容覆盖平台配置、订单状态、支付与配送方式、用户主数据、商品主数据、用户行为明细、订单主表与订单明细,同时包含系统登录注册所使用的账号表 auth_user,能够支持用户画像分析、商品与订单分析、转化漏斗分析、BI 可视化展示、SQL/Python 数据处理训练以及 ETL/数仓建模等学习与实验任务;需要特别说明的是,该数据集属于课程与研究用途的模拟数据,并非真实生产业务数据,不应用于真实商业决策、对外经营披露或其他合规敏感场景,且登录表中的密码字段为单向加密后的哈希值而非明文密码,无法反推出原始密码。

2026-04-29

2023-2024 全国演唱会数据集(18列,20000条记录)CSV

2023年至2024年,全国演唱会市场呈现爆发式增长。大型演唱会及音乐节数量显著攀升,场均观演人次屡创新高,跨城观演比例普遍超过50%。市场呈现强头部效应,一线城市及新一线城市为核心承载区,同时向二三线城市下沉。消费端需求旺盛,演出经济成为带动文旅消费的重要引擎。 包含字段:concert_id、演唱会名称、艺人、艺人热度分、音乐风格、省份、城市、演出场馆、场馆类型、场馆容纳量、开演日期、闭演日期、演出时长(分钟)、主办方、票价下限(元)、票价上限(元)、实际入场人数、售票状态/备注。

2026-04-29

岗位求职招聘综合数据集(3文件,9000条记录)CSV

1. 岗位数据 (jobs.csv) 5000条记录 包含以下字段: 基本信息 :job_id, job_title, job_category(技术/产品/运营/市场/设计/职能) 公司信息 :company_name, company_size, company_type 岗位要求 :city(15个城市), education(5个学历等级), experience(6个经验等级) 薪资信息 :salary_min, salary_max, salary_avg 技能标签 :skills(逗号分隔的技能列表,如"Java,Spring Boot,MySQL") 非结构化文本 :job_description, requirements 其他信息 :publish_date, views, applications 2. 求职者数据 (candidates.csv) 1000条记录 包含以下字段: 基本信息 :candidate_id, name, age, gender 教育和经验 :education, experience 地域偏好 :current_city, preferred_cities 职业偏好 :preferred_categories 技能和薪资 :skills, expected_salary_min/max/avg 非结构化文本 :self_introduction 注册时间 :registration_date 3. 应聘数据 (applications.csv) 3000条记录 包含以下字段: 关联信息 :application_id, job_id, candidate_id 匹配度评分 :skill_match_score, salary_match_score, education_match_score, experience_match_score, total_match_score 匹配结果 :is_matched(0/1,用于分类预测) 应聘状态 :status(待处理/已查看/面试中/已录用/已拒绝)

2026-04-29

1911 年以前朝代建筑特征数据集(7列,519条记录)CSV

1911 年以前中国古建筑的数量统计信息,涵盖建筑类型、朝代分布等关键维度,数据来源权威可靠,可直接用于古建筑保护、历史文化研究及可视化系统开发。 包含字段:名称、类型、朝代、所在地、结构、材料、核心特点。

2026-04-29

100013366-基于Python+MySQL实现用户加密存储验证系统

本项目基于 Python 2.7 与 MySQL 5.7 开发,面向第三方数据库托管场景,实现隐私数据加密存储与权限验证。采用双层加密方案:用户密码支持 MD5/SHA1 哈希加密,业务明文通过自定义伪码表 + 双层 Base64 算法结合专属密钥加密,无密钥无法解密。系统提供注册、登录、数据增删改查、密码 / 密钥更新等完整功能,支持用户名冲突处理与默认配置。开发中解决了哈希类型异常、事务未提交、锁等待超时等问题,通过 PyMySQL 完成数据库交互并确保事务提交。项目可防止第三方查看敏感数据,兼顾安全性与易用性,适用于隐私数据保护场景。

2026-04-28

棉铃与花朵识别数据集(2类,4966张图像)YOLO格式

棉花识别模型和训练素材 主要识别棉花 花铃

2026-04-28

2014-2018 全国国控站环境空气质量日数据集(5文件,22列)CSV

该数据可直观反映不同站点在特定时间段内的空气质量状况,为AI模型在环境预测、污染溯源、智能预警等场景下的建模与优化提供高质量、可计算的数据支撑。 时间范围:2014年-2018年 时间维度:日数据。 涵盖范围:全国超1600个国控站点。 指标参数:PM2.5、PM10、SO2、NO2、CO、O3浓度、空气质量指数(AQI)、空气质量等级、首要污染物、地理信息(经纬度)等。

2026-04-28

2014-2018 城市环境空气质量日数据集(17列,512540条记录)CSV

该数据集可直观反映不同城市在特定时间段内的空气质量状况,为AI模型在环境预测、污染溯源、智能预警等场景下的建模与优化提供高质量、可计算的数据支撑。 时间范围:2014年-2018年 时间维度:日数据。 涵盖范围:全国超300个地级及以上城市。 指标参数:PM2.5、PM10、SO2、NO2、CO、O3浓度、空气质量指数(AQI)、空气质量等级、首要污染物、地理信息(经纬度)等。

2026-04-28

淘宝用户行为数据集(9列,99457条记录)CSV

本数据集为真实场景下的淘宝用户行为数据,包含用户 ID、商品 ID、商品类目、行为类型、时间戳等多个有效字段,能够支撑用户聚类分析、消费者行为模式挖掘、用户活跃度分析、商品偏好研究等多项数据分析任务,适用于电商用户行为相关的科研实践与算法验证。

2026-04-28

2023-2025 智能手机用户使用行为数据集(5文件,10100名用户)CSV

2023年4月—2025年12月采集了10100名智能手机用户在近三年内的行为记录,涵盖应用使用、网络流量、设备交互、时空分布等多维度信息,并包含最新的2025年数据。

2026-04-28

电子商务网站的用户事件数据集(9列,1048575条记录)CSV

包含字段:事件时间、事件类型、产品ID、类别ID、类别代码、品牌、价格、用户ID、用户会话。

2026-04-28

人行道损伤数据集(3628张图像)YOLO格式

人行道损伤数据库是一个用于城市基础设施维护的计算机视觉数据集,包含大量人行道图像及精细标注,涵盖裂缝、坑洼、隆起等常见损伤类型,为自动化损伤检测与评估提供标准化的训练与测试基准。

2026-04-28

生活垃圾检测数据集(4类,6818张)YOLO格式

共【6818】张,模型分为【4】类, names: ['Hazardous', 'organic', 'recyclable', 'residual'] 名称:['有害垃圾', '厨余垃圾', '可回收物', '其他垃圾'] 按照8:1:1划分为训练集、验证集、测试集, 其中训练集【5454】张,验证集【682】张,测试集【682】张, 使用标注工具:labelImg 标注规则:对类别进行画矩形框 数据集YOLOv5-YOLOv26通用!

2026-04-28

验证码识别数据集(5万张图像)JPG

数据集包含约5万张验证码图片,图片为灰色渐变底色,字符为4位数字+大小写字母组合,用于机器学习验证码识别模型训练。

2026-05-07

高校学生学业发展与风险预警数据集(477条记录,2512条记录)CSV

本数据集采集了2022年至2025年入学的四届高校学生(截至2026年4月,涵盖大一至大四学年)的综合学业档案。数据并非单纯的考试成绩,而是融合了高考基础、在校学业表现、日常行为习惯、心理健康指标以及经济/生源背景的多维数据集。其核心价值在于揭示了学生背景与学业结果之间的潜在联系,并直接关联了挂科风险等级这一关键预测目标。 核心特征与维度 数据集共包含 49个维度,可以归纳为以下五大核心板块: 学生画像与背景 (Profile & Background) 基础身份:学号、性别、年级、入学年份。 学院专业:所属学院(如信息工程、土木工程、文学院等)、专业名称、学科类型(理/工/文/综)、班级信息。 生源背景:生源地(华东、华北等)、生源地类型(城市/县镇/农村)、是否独生子女、家庭收入水平、是否贫困生、高考成绩。 学业表现 (Academic Performance) 课程成绩:数学、英语、政治、专业基础课、专业核心课成绩。 综合指标:上学期GPA、当前GPA、班级排名、排名波动情况、已获学分、当前学分修读率。 奖惩记录:是否通过CET-4/6、是否获得奖学金、是否有学业警告历史。 行为与生活习惯 (Behavior & Habits) 学习投入:课程难度感知、教师评分、到课率、作业完成率、课堂参与度、线上学习时长、图书馆访问次数。 生活作息:手机使用时长、运动频率、平均睡眠时长、消费规律性、睡眠规律性。 辅导情况:是否接受过辅导(家教/补习)。 心理与社交 (Psychological & Social) 心理指标:心理测评得分、压力等级、社交互动频率。 风险标签 (Risk Label) 核心标签:挂科风险等级(分为:低风险、中风险、高风险)。 明细指标:过往挂科总数、当前学期挂科门数。 数据时效性与场景 (Context) 时间跨度:数据记录的时间跨度为 2022年至2026年4月。 当前状态:截至2026年4月,2022级学生已处于大四下学期(毕业班),2025级学生处于大一阶段。 应用场景: 学业预警模型训练:利用大一至大三的数据预测“挂科风险等级”。 教育数据挖掘:分析家庭背景(如是否贫困、生源地)对学业成绩(GPA、排名)的影响。 学生画像构建:研究手机使用时长、睡眠规律与奖学金获得率之间的相关性。

2026-05-07

农产品批发市场蔬菜价格监测数据集(8列,3000条记录)CSV

这是一套全国农产品批发市场 / 农贸市场的蔬菜价格监测数据,由农业农村部、商务部及各地发改委价格监测部门采集汇总,覆盖全国主产区与销区核心市场,用于跟踪 “菜篮子” 产品价格动态、稳定市场供应、服务政府调控及指导产销决策。数据记录不同蔬菜品种在特定交易日的交易价格区间、规格、产地及计量单位,反映蔬菜从产地到批发市场的流通价格水平,是分析季节性波动、产地供需、物流成本及... 数据说明 品名:指各类蔬菜的具体品种名称,是区分不同蔬菜品类的核心标识。 最低价:当日对应蔬菜在市场交易中成交的最低单价。 最高价:当日对应蔬菜在市场交易中成交的最高单价。 平均价:当日该蔬菜所有交易价格核算后的综合平均售价,反映整体行情水平。 规格:蔬菜的品级、成色、包装标准或售卖等级,如散装、精品、统货等区分标准。 产地:对应蔬菜的主要种植生产来源地,标注产区地域信息。 单位:蔬菜计价使用的度量单位,常见有斤、公斤、吨等。 发布日期:蔬菜价格数据统计、采集并公示的具体日期,用于按时间追踪价格涨跌变化。

2026-05-07

大学生就业选择数据集(11列,10000条记录)CSV

包含字段:ID,性别,专业,学历,毕业去向,就业行业,期望薪资,工作城市,满意度评分,是否有实习经历,城市。

2026-05-07

招聘信息汇总数据集(10列,295条记录)CSV

这份数据来源于前程无忧(51job),是国内头部招聘平台的公开招聘信息汇总,覆盖全国数百个城市、上千万条实时岗位与企业数据。数据由企业自主发布、平台结构化采集,包含岗位、公司、学历、薪资、经验、规模、福利等核心维度,广泛用于人才市场供需分析、行业薪资趋势研究、企业招聘策略制定及求职者择业参考,具备样本量大、时效性强、维度全的特点。 数据说明 岗位:企业发布的具体职位名称,如 “Java 开发工程师”“市场专员”。 公司:招聘企业的全称。 学历:该岗位实际招聘中对应的学历层次(如大专、本科)。 公司性质:企业注册类型,如民营企业、国有企业、外资企业、上市公司等。 薪资:岗位标注的薪酬范围(如 6K-10K / 月、15-25K / 月)。 学历要求:岗位明确的最低学历门槛(如本科及以上)。 工作经验:岗位要求的从业年限(如 1-3 年、3-5 年、应届毕业生)。 公司规模:企业员工人数区间,如 50 人以下、50-200 人、500-1000 人等。 公司类型:企业所属行业类别,如互联网 / 科技、制造业、金融、教育等。 公司福利:企业提供的员工保障与福利,如五险一金、带薪年假、节日福利、餐补、住房补贴等。

2026-05-07

基于双语参数映射与同义词扰动的电商领域双语平行语料库

双语数据集(基于双语参数映射 + 同义词扰动) 基本信息: - 平行翻译对总数:120,000 - 模板数量:171 - 产品术语数量:82 - 材质术语数量:14 - 颜色术语数量:12 数据划分: - 训练集 (train):96,000 - 验证集 (val):12,000 - 测试集 (test):12,000 数据处理统计: - 原始总数:120,000 - 去重后:120,000(无重复) - 质量过滤(bad_ratio):955 条(长度比例异常) - 术语标注覆盖率:94,112 条(78.4%) 领域分布: - 物流售后 (logistics_after_sales):39,730 - 产品描述 (product_description):39,529 - 交易 (transaction):39,786 数据集包含电商领域的三个子领域,覆盖翻译、售后、产品描述等典型场景。

2026-05-07

英国跨国电商交易行为数据集(8列,541909条记录)CSV

本数据集包含了一家在英国注册的在线零售商在 2010年12月1日 到 2011年12月9日 期间发生的所有交易记录。 对于数据分析初学者来说,这是学习商业分析(Business Analytics)、客户分群(Customer Segmentation)和关联规则挖掘(Association Rules)的必经之路。 该零售商主要销售全场合礼品(All-occasion gifts),且许多客户是批发商。 字段名称 (Column),含义 (Description),数据类型: InvoiceNo,发票编号。6位整数。若以 'C' 开头,表示该订单已取消(退货)。,String StockCode,产品代码。5位整数,每个代码唯一对应一种商品。,String Description,产品名称/描述。,String Quantity,交易数量。注意: 负数表示退货订单。,Integer InvoiceDate,发票日期和时间。记录交易发生的时刻。,DateTime UnitPrice,单位产品价格(英镑)。,Float CustomerID,客户编号。每个客户拥有唯一的5位整数ID。,String Country,客户所在国家的名称。,String

2026-05-07

电商数据集(8列,50000条记录)CSV

包含字段:订单编号、产品编号、类别、单价、数量、总金额、时间戳、地区。

2026-05-07

护肤品和洗护用品的销量数据集(13列,2474条记录)CSV

包含字段:id、名称、价格、销量、店铺名称、位置、品牌、图片链接、详情链接、评分、评论数、类别、抓取时间。

2026-05-07

日本人的胡须密度预测数据集(16列,1000条记录)CSV

包含字段:年龄、身高_cm、BMI、血清睾酮浓度_nmolL、游离睾酮比例_百分、体脂率_百分、毛囊敏感程度、每周运动时长_h、运动类型、每日吸烟支数、民族族群、父亲胡须密度等级、居住地域、年平均气温_℃、年平均湿度_百分、胡须密度_万根每平方厘米。

2026-05-07

在线购物者购买意向数据集(18列,12330条记录)CSV

这份数据是在线购物者购买意向数据集,记录电商网站一整年的用户访问会话行为,包含管理类、信息类、产品相关页面的访问次数与停留时长,还有跳出率、退出率、页面价值、特殊日期、月份、操作系统、浏览器、地区、流量来源、访客类型、是否周末等行为及环境特征,目标变量为是否产生购买收益,常用于构建机器学习二分类模型,分析用户浏览行为与购买转化的关联,挖掘影响电商成交的关键因素,做用户购买意向预测和网站运营优化研究。 数据说明 Administrative:用户访问网站管理类页面的次数;Administrative_Duration:用户在管理类页面累计停留时长;Informational:用户访问网站信息类页面的次数;Informational_Duration:用户在信息类页面累计停留时长;ProductRelated:用户浏览商品相关页面的访问次数;ProductRelated_Duration:用户在商品相关页面累计停留时长;BounceRates:页面跳出率,指仅浏览单个页面就直接离开的访客比例;ExitRates:页面退出率,代表该页面成为用户本次浏览最后一页的概率;PageValues:页面价值,衡量页面为网站带来营收贡献的量化指标;SpecialDay:访问日期距离节日、促销等特殊日子的贴近程度,数值越接近 1 距离越近;Month:用户进入网站访问所处的自然月份;OperatingSystems:用户访问设备所使用的操作系统编码;Browser:用户浏览网页所使用的浏览器类型编码;Region:用户访问时所属的地区编号;TrafficType:用户进入网站的流量来源渠道类型;VisitorType:划分访客类型,分为新访客与回访老访客;Weekend:标识本次访问时间是否为周末;Revenue:数据集目标标签,代表用户本次访问是否产生购物成交收益。

2026-05-06

中文金融舆情情绪分析数据集(5000条)JSON

包含10大类金融事件的舆情文本及情感标注数据(业绩公告、政策消息、市场波动、个股异动、行业热点、公司负面、资产重组、券商研报、宏观数据、融资动态),每条文本包含具体金融实体、数字、股票代码,适合金融NLP模型训练。

2026-05-06

淘宝母婴购物数据集(2文件,贸易+用户,12+8列,30210+962条记录)CSV

扩展贸易数据 expanded_trade_data 包含字段:用户ID、拍卖ID、分类ID、子分类ID、属性、购买数量、日期、单位价格、总费用、支付方式、是否退款、评分 扩展用户数据 expanded_user_data 包含字段:用户ID、出生日期、性别、省份、城市、注册日期、会员等级、父母年龄

2026-05-06

用户行为数据集(34列,176342条记录)CSV

包含字段:事件ID、用户ID、会话ID、事件时间、事件日期、用户省份、用户城市、来源渠道、设备类型、操作系统、浏览器、是否新用户、会员等级、搜索关键词、搜索结果数、页面类型、行为类型、路径步骤、停留时长秒、滚动深度、目的地、景点名称、门票名称、门票价格、是否加购、购物车商品数、是否下单、是否支付、订单ID、订单金额、订单状态、是否使用优惠券、支付方式、是否转化。

2026-05-06

中文民宿客服对话数据集(5000条)JSON

包含民宿客服场景的多轮对话数据,覆盖预订咨询、入住问题、退房纠纷等10大类场景,每类500条,共5000条。每条对话包含场景标签、城市区域、情感标签、解决方式和多轮对话内容。

2026-05-06

淘宝交易数据集(10列,69555条记录)CSV

该数据集用于淘宝平台用户行为分析,包含了用户在电商平台上的完整行为轨迹。从浏览商品到最终购买的整个决策链路都被详细记录下来,涵盖了用户ID、商品信息、品牌数据、行为类型和时间戳等关键维度。通过分析这些数据,可以深入了解用户的消费偏好、购买习惯和品牌忠诚度,为精准营销和个性化推荐提供数据支撑。同时,时间戳信息使得能够进行时间序列分析,识别销售高峰期和季节性规律,为库存管理和促销策略制定提供科学依据。商品类别和品牌维度的数据则有助于分析市场竞争格局和产品定位策略,已做脱敏处理。 包含字段:用户ID、商品ID、品牌、品牌ID、商品名称、商品类别、商品类目ID、行为类型、时间戳、售价。

2026-05-06

豆瓣阅读书籍数据集(4列,560条记录)XLSX

包含字段:名称、类型、作者、描述。

2026-05-06

中文保险理赔合规客服对话数据集(1000条)JSON

包含10大保险理赔与合规客服场景的多轮对话数据(车险报案、医疗报销、寿险理赔、保单变更、续保缴费、拒赔申诉、退保争议、合规双录、投诉升级、免责解释),每条3-6轮对话,适合保险行业AI客服训练。

2026-05-06

中国主要的旅游景点数据集(14列,678条记录)XLSX

包含字段:省份、城市、区县、名称、评分、价格、销量、坐标、简介、具体地址、经度、纬度、景点类型、星级_编码。

2026-05-06

论坛用户评论数据集(5列,17176条记录)CSV

这是一份来自耳机发烧友论坛的用户评论数据集,包含超过2800条关于各类耳机产品的讨论记录。数据集涵盖了用户对音质、配置、价格、舒适度等多个维度的主观评价,涉及森海塞尔、拜亚动力、HIFIMAN等众多知名品牌的经典型号。评论中既有专业的技术分析,也有普通用户的使用体验分享,情感倾向分布均衡,为分析耳机市场口碑和用户偏好提供了丰富的文本素材。 包含字段:内容 ID、内容、主题、情感词、情感值。

2026-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除