2021年09月_小夕Coding

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创【动手学树莓派】安全使用树莓派

出于安全的考虑，更改默认用户名、root密码、安装防火墙或者使用密钥远程ssh登陆。以下方法也适用与其他linux发行版。更改树莓派用户名创建新用户 sidoadduseranran将提示您为新用户创建密码。这里新用户名设置成了anran，此时新用户将有一个家庭目录在。/home/anran/ 添加到组，并授权 sudousermod-a-Gadm,dialout,cdrom,sudo,audio,video,plugdev,games,users,...

2021-09-29 21:46:51 171

原创【动手学树莓派】树莓派安装openCV做图像识别

有时候我们会使用树莓派和摄像头去做图像识别，在树莓派和LINUX系统中最常用opencv去做图像识别，这次来介绍下树莓派安装opencv和用树莓派做图像识别。一、树莓派的系统安装就不介绍了。直接开机打开树莓派的命令窗口，安装openCV的依赖包，步骤有点多。1.1 更新系统$ sudo apt-get update$ sudo apt-get upgrade1.2 安装编译openCV源码的工$ sudo apt-get install build-essential cmak

2021-09-27 08:00:26 3360 1

原创【动手学树莓派】树莓派开机连接方式

树莓派连接启动方式有很多种，操作树莓派用显示器肯定是最好的也方便，HDMI最方便，直接连接即可。不使用显示屏在同一个网络下可以：SSH远程连接（纯命令操作)、VNC远程桌面。(手机热点不支持远程)。一、显示屏连接方式所述为连接显示屏方式，将安装好系统的内存卡插入树莓派连接HDMI线，树莓派4B接口为Micro HDMI，它有两个micro HDMI视频输出口，可以双屏输出显示。如只连接一台显示器接口插在靠近电源接口那端为主屏接口，然后在插上电源通电启动即可。树莓派的USB接口，可以接电脑使用的U

2021-09-27 07:49:00 1201

原创【动手学树莓派】搭建个人用服务器

作为一名开发人员，我有时候想在外网写一些脚本或者小程序，这就需要一台自己的服务器。刚开始我是在某云上租用了一台云服务器，但是特惠到期后续费需要一年上千元，成本较高，于是我便决定搭建一台自己的服务器。搭建个人用服务器，较为常见的办法就是使用树莓派。树莓派是为计算机编程教育而设计的只有信用卡大小的微型电脑，其系统基于Linux。一个4C2G的4B版本树莓派，个人使用已绰绰有余。新购入的树莓派相当于一台空白的物理机，我们需要给它烧录系统。它没有外部存储，购买的时候附赠了一张SD卡，系统和文

2021-09-27 07:47:22 3003

原创【动手学树莓派】案例实操：点亮你的第一个LED（重点）

今天教大家通过树莓派的GPIO接口来控制电子设备。我们的第一个电子设备当然要从LED灯开始喽。还等什么，让我们的LED灯闪烁起来吧。电路搭建要搭建这个电路，我们需要一个树莓派、一个LED灯、一块面包板和一个220欧电阻。然后按照下面的接线图搭建好LED闪烁电路。需要注意的是，LED是一种常用、廉价的光源，但其使用方式需要格外注意。如果将其直接接在高于1.7V的电压电源上，会产生非常大的电流，可能会烧毁LED或供电设备，而GPIO管脚的输出电压为3.3V，通常情况下需要在LED和树莓派管脚之间串联

2021-09-26 20:11:11 817

原创【动手学树莓派】开始：树莓派基础外观图并一步一步配置和初始化树莓派（重点）

树莓派基础外观图树莓派外设图树莓派引脚图树莓派尺寸图树莓派原理图图片较大，可以下载观看：https://shumeipai.nxez.com/wp-content/uploads/2018/09/rpi_SCH_4b_4p0_reduced.pdf树莓派供电树莓派开发板的两种供电方式：使用Type-C供电：电源头的参数要求是5V，3A。推荐：5V@3A USB电源适配器（美标）使用POE供电：需要另外购买一个POE hat，连接之后可使用网线POE供电。（暂时没有提供相关技术支持

2021-09-25 11:03:05 356

原创【动手学树莓派】开始：从选购到上手：树莓派零基础入坑指南（重点）

前面的文章只是开一个头，从今天起我们正式学习树莓派，从选购到上手：递上树莓派零基础入坑指南注：本文需要用到搭载 Windows 或 macOS 的电脑（下文称为 PC）。文中操作演示在搭载 Windows 的电脑上进行，但我会给出在搭载 macOS 的电脑上操作的方法。树莓派是只有信用卡大小、可运行操作系统的计算机（除了 2021 年 1 月份发布的新品 Raspberry Pi Pico，它是一款单片机开发板）。第一款树莓派于 2012 年发售，至今已有 9 年。9 年间，大大小小、稀奇古怪的树

2021-09-25 10:47:12 730

原创【使用Python动手学树莓派】5 初探我们要使用的Linux内核

Linux内核组成部分linux内核由7部分组成:系统调用接口、进程管理、内存管理、虚拟文件系统、网络协议栈、处理器体系相关部分、设备驱动。(1)系统调用接口(SCI)。内核为应用层提供的使用内核的接口，应用层可以通过系统调用接口，向内核申请服务。SCI与API有何区别。SCI为系统调用接口，API为应用程序调用接口；应用程序使用API完成既定任务，一个API可以调用一个SCI函数、可以调用多个SCI函数、也可以不调用SCI函数(例如，数据计算库中的数值计算API接口)。(2)进程管理。进程

2021-09-25 10:10:22 154

原创【使用Python动手学树莓派】4 操作系统为何物？

百度百科定义操作系统是管理计算机硬件与软件资源的计算机程序，同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入设备与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。帮我们管理好计算机硬件，我们可以通过操作系统友好的使用计算机。操作系统分类操作系统体系结构划分：(1)简单体系结构。例如ucos系列、FreeRTOS、SylixOS、VxWorks(基本级)。特点：用户层与内核层在一个地址空间中。不使用或有限

2021-09-24 20:11:27 242

原创【使用Python动手学树莓派】3、zynq系列内部组成

zynq系列内部组成zynq内部分为PS端和PL端。PS端就是CPU端，与刚刚介绍的imx6q基本一致；PL端就是逻辑单元端。zynq有什么优势?(1)片上部分硬核外设既可以由PS端控，可以有PL端控制。但一旦PS端控制了，PL端就不能控制，同理，PL端控制了，PS端就不能控制。这些硬核外设由谁控制，芯片上电运行的FPGA配置文件决定。(2)片上硬核不够用了怎么办?例如，你需要10各uart控制器，这时你可以用PL端逻辑资源来搭uart控制。zynq这么好，有什么缺点吗?(1)太贵了、功耗大。可

2021-09-24 10:51:33 571

原创【使用Python动手学树莓派】2、近距离看看计算机硬件体系结构——观摩下芯片里面的部分

NXP公司imx6q处理器原理组成框图本来想给出树莓派3B+上使用的BCM2837处理器原理组成框图，但搜遍全网找不到，后来得知，这是定制款，官方提供片上外设操作地址空间和寄存介绍。imx6q片内原理构成理论上跟BCM2837一致。1)4个Cortex-A9内核（Cortex-A系列——高性能、Cortex-R系列——高安全、Cortex-M系列——低成本）。(2)AXI和AHB总线与片上外设相连，高速片上外设直接连接至AXI和AHB总线上，低速设备在通过APB总线连至高速总线上。对于每一种总线，

2021-09-24 10:47:49 149

原创【使用Python动手学树莓派】1、近距离看看计算机硬件体系结构——主板

计算机组成打开PC机机箱，发现一台PC机主要有核心处理器CPU、内存条、主板、硬盘、电源、显卡等组成。开拆手机或者看看咱们的树莓派开发板，也是有核心处理器、主板、“硬盘”（emmc或者TF卡）、电源等组成。那计算机可以做到手机或者树莓派这么小，台式PC机还有存在的必要吗？当然有必要，他们的差别就在对数据的处理能力上，这个处理能力主要由核心处理器CPU决定。电脑主板图片：树莓派图片：核心处理器的分类按指令集划分：CISC(复杂指令集计算机)和RISC(精简指令集计算机)。按体系架构划分：x

2021-09-24 10:46:27 1855

原创【动手学树莓派】.本课程面向的群体和参考资料

课程内容本课程是AIOT攀登之旅的第一站——《动手学树莓派——python上篇》，用python快速上手树莓派和操作系统，从应用层理解操作系统提供的工具。完成本课程后，您可以快速掌握、部署“树莓派官网”或者“树莓派实验室”提供的其他例程，达到授人以渔的目的。本课程面向的群体：(1)在校大学生。希望本课程成为计算机体系结构、操作系统、计算机网络、python编程语言等课程的课外实践课，在树莓派上不断地试错，在动手中理解计算机系统。(2)嵌入式工程师。如果您之前从事无操作系统的单片机开发，您想继续了解高

2021-09-24 10:31:10 170

原创【动手学树莓派】成为时代的弄潮儿，不做局外人

成为时代的弄潮儿，不做局外人AIOT时代已经来临，但我们该如何深入其中呢？如何不断地提升自己技能的层次，不被时代淘汰了？That’s a good question.站在AIOT的山脚下，抬头望去，高耸入云的山峰，从山脚下根本望不到顶峰。必然会发出，路在何方的感叹！的确，路在何方呢？作为一名嵌入式世界里的老鸟，有义务、有责任带领新手们一起攀登这座高山，我已经走过的弯路，可以带领大家避开；但毕竟我也在攀登的途中，对于没走过的路，我也会先行探路，分享出我的经验教训。全部旅程我准备按照如下路线，带领各位攀

2021-09-24 10:29:34 119

原创【动手学树莓派】8年老司机谈嵌入式系统的未来

嵌入式未来10年的如何发展截止到2018年，嵌入式系统发展一直处于不温不火状态，还记得2012年在读硕士期间，老师曾给过两幅图片：一幅高楼大厦、灯火通明、另一幅小小的村落、点点灯光。高楼大厦代表的互联网行业，一直处于蓬勃发展；而嵌入式则一直处于小村落状态。但万事万物的发展都是由逐步的量变转为质变，目前嵌入式蓬勃发展的三个基本条件已经成熟，未来的嵌入式必将迈入AIOT(AIOT=AI+IOT)时代。咱们先看看三个基本条件：算力的提升和SOC的成熟、5G的商业化普及、硬件友好性深度学习算法的逐步成熟。1.

2021-09-24 10:28:46 240

原创【C语言】 26 其他库函数

其他库函数stdarg.h 可变长度实参void va_start(va_list ap, last);type va_arg(va_list ap, type);void va_end(va_list ap);stdarg.h提供了一种工具可以让我们自行编写的函数具有可变长的参数列表（varying number of arguments of varying types）。stdarg.h定义了一种va_list类型和三种宏，名为va_start, va_arg, va_end, 可以把这

2021-09-14 15:34:02 60

原创【C语言】 25 错误处理

第二十五章国际化特性locale.h 本地化locale.h提供的函数用于控制标准库中对于不同的地区会不一样的部分。地区通常指一个国家，或者一个国家的不同区域。在标准库中，依赖地区的部分包括：数值的格式。比如一些地区的小数点是用逗号表示货币的格式。不同国家的货币符号不同。字符集。字符集依赖于地区使用的语言。亚洲国家通常比西方国家需要更大的字符集。日期和时间的表示格式。类别通过修改地区，程序可以改变它的行为来适应不同地区。可以使用一些宏来指定一个类型：LC_

2021-09-14 15:32:56 176

原创【大数据Kafka系列】日志存储

日志存储Kafka 中的消息存储在磁盘上，消息以 topic 为基本单位进行归类文件目录布局一个分区对应一个 Log，为了防止 Log 过大，Kafka 引入了 LogSegment，将日志分段向 Log 追加消息时是顺序写入，只有最后一个 LogSegment 才能执行写入操作，随着消息不断写入，当最后一个 segment 满足一定条件，创建一个新的 segment，新消息写入此 segment为了方便消息检索，每个 LogSegment 日志文件都有偏移量和时间戳索引文件消息压缩Kaf

2021-09-13 20:16:55 247

原创【大数据Kafka系列】Topic-Partition

Topic-Partition分区有多副本机制，每个副本对应一个日志文件，每个日志文件对应一个至多个日志分段（LogSegment），每个日志分段还可以细分为索引文件、日志存储文件和快照文件等主题管理创建主题创建方式：通过 kafka-topics.sh 脚本进行创建ls /tmp/kafka-logs/ | grep topic-create // 查看节点中创建的主题分区[zk: localhost:2181/kafka(CONNECTED) 2] get /brokers/topics/

2021-09-13 20:16:18 233 1

原创【大数据Kafka系列】Consumer

Consumer消费组每个消费者对应一个消费组，当消息发布到主题后，只会被投递给订阅它的每个消费组中的一个消费者，topic 中的每一个分区只能被一个消费组中的消费者所消费消息投递模式点对点基于队列，消息生产者发送消息到队列，消费者从队列接收消息消息会被均匀的投递给同一消费组下的所有消费者（所有消费者属于同一消费组），每条消息被一个消费者处理发布 / 订阅发布者将消息发送到某个 topic，消费者从 topic 订阅，发布于订阅互相保持独立不需要进行接触，在消息一对多广播时采用

2021-09-13 20:15:38 108

原创【大数据Kafka系列】Producer

Producer发送消息模式发后即忘：不关心消息是否正确到达，性能高，可靠性差同步：可靠性高，要么发送成功，要么异常，阻塞等待，性能较差异步序列化生产者通过序列化器将对象转成字节数组发送给 Kafka消费者哦通过反序列化器把接收到的字节数组转成相应对象分区器消息在通过 send() 方法发生往 broker 的过程中，需要经过拦截器、序列化器（必需）和分区器作用：为消息分配分区拦截器生产者拦截器：过滤不符合要求的消息、修改消息内容消费者拦截器整

2021-09-13 20:15:03 96

原创【大数据Kafka系列】Kafka 基础

Kafka 基础消息系统系统解耦、冗余存储流量削峰、缓冲、异步通信、拓展性、可恢复性消息顺序性保障、回溯消费存储系统：把消息持久化到磁盘，降低数据丢失的风险流式处理架构组成若干 Producer：将消息发送至 Broker若干 Broker：服务代理节点，将收到的消息存储到磁盘若干 Consumer：从 Broker 订阅主题而消费消息ZooKeeper 集群：用于负责集群元数据的管理、控制器的选举Topic-Partition：消息以主题为单位进行归类，生产者负

2021-09-13 20:14:26 61

原创【数据结构和算法】平衡查找树

总结自《算法》(第4版)查找树一般的二插查找树如果节点有序插入，树的高度会是n，因此无法实现logn的查找，平衡查找树保证树的高度平衡，因此不管节点插入顺序如何，都可以满足logn的查找2-3查找树一棵2-3查找树或为一棵空树，或由以下节点组成：2-节点：含有1个键（及其对应的值）和2条链接，左链接指向的2-3树中的键都小于该节点，右链接指向的2-3树中的键都大于该节点3-节点：含有2个键（及其对应的值）和3条链接，左链接指向的2-3树中的键都小于该节点，中链接指向的2-3树中的键都位于.

2021-09-13 18:49:14 831

原创【数据结构和算法】排序

1.插入排序逐个处理待排序的记录，每个记录与前面已排序已排序的子序列进行比较，将它插入子序列中正确位置代码template<class Elem>void inssort(Elem A[],int n){ for(int i = 1;i < n;i++) for(int j = i;j >= 1 && A[j] < A[j-1];j--) swap(A,j,j-1);}性能最佳：升序。时间复杂度

2021-09-13 18:39:54 164

原创【100分】小朋友排队

题目描述已经很明确了，我们需要对其他小朋友的身高进行排序，排序的规则是按照他们与小明身高差的绝对值从小到大进行排列。小明今年升学到了小学1年级来到新班级后，发现其他小朋友身高参差不齐，然后就想基于各小朋友和自己的身高差，对他们进行排序，请帮他实现排序。接下来，我们对这个元组列表进行排序，排序的规则是首先按照差值从小到大排序，如果差值相同，则按照小朋友身高从小到大排序。然后，我们可以计算每个小朋友与小明身高的差的绝对值，并将这个差值和对应的小朋友身高放入一个元组列表中。最后，输出排序后的小朋友身高列表即可。

2021-09-13 18:37:08 572

原创【数据结构和算法】二叉树

两种特殊二叉树满二叉树（下图左）：除叶子节点外的所有分支节点都含有2个非空子节点的二叉树完全二叉树（下图右）：除了最后一层，其余层都是“满”的，这样的二叉树是完全二叉树二叉树定理1）任意二叉树度数为2节点的个数等于叶节点个数减1当只有1个节点时，度为0。每派生出1度，就会多出1个节点。派生出的度和派生出的节点数一定相等。那么就得出了总度数和节点总数的关系：节点总数 = 总度数 + 1设度数为2的节点数为X2，度数为1的节点数为X1，度数为0的节点数为X0。可以得出如下关系式：X2

2021-09-13 18:32:44 681 1

原创【100分】【约瑟夫问题】

我们从数列的首个位置开始计数，并在计数达到m后，将该位置的数值出列，同时更新计数值为出列的数值，然后从下一个位置开始重新计数。这个思路的关键在于，我们在每次计数达到m时，都需要将该位置的元素出列，并更新计数值为该元素的数值。检查当前计数是否等于m。如果是，就将该元素添加到输出列表，将m更新为该元素的数值，重置计数，减小数列的长度。第一轮计数出列数字为 2，计数值更新 m=2，出列后数列为 3,1,4，从数值 4 所在位置从新开始计数。从数列首位置开始计数，计数到 m 后，将数列该位置数值替换计数值 m，

2021-09-13 18:31:23 96

原创【大数据Spark系列】Spark面试题总结（一）

【大数据Spark系列】Spark面试题（一）

2021-09-12 11:39:09 135

原创【100分】【拔河比赛】

输入为一个数组，记录了部门人员的身高、体重信息。要求输出一个大小为10的二维数组，表示选拔出的10名参赛员工的身高、体重信息。输入为N行员工信息，表示部门报名参加选拔的候选人信息，每行有两个数字，使用空格分隔，表示员工的身高、体重信息。要求输出一个10行的已经排序的参赛员工信息数据，每行有两个数字，使用空格分隔，表示员工的身高、体重。通过以上步骤，我们可以得到按照规则选拔出的10名参赛员工的身高和体重信息，并将其按要求输出。输入为一个数组，记录了部门人员的身高、体重信息，如[身高,体重]的方式放置；

2021-09-12 11:35:39 358

原创【100分】【最大N个数与最小N个数的和】

这道题目是给定一个数组，要求计算数组中的最大N个数和最小N个数，并返回它们的和。首先要对数组进行去重，然后对数组进行排序。接下来，分别计算最大N个数和最小N个数的和，同时要注意判断最大N个数和最小N个数是否有重叠，如果有重叠则输出-1。给定一个数组，编写一个函数来计算它的最大N个数与最小N个数的和。代码实现了上述思路，并对输入是否合法进行了处理，输出结果或者-1。最大N个数与最小N个数不能有重叠，如有重叠，输入非法返回-1。输出最大N个数与最小N个数的和。【最大N个数与最小N个数的和】

2021-09-12 11:34:48 470

原创【100分】【用户调度问题】

最后，返回dp矩阵的最后一行的最小值，即为最优策略组合下的总的系统资源消耗数。首先，我们需要定义一个二维数组dp，其中dp[i][j]表示前i个用户使用策略A/B/C时，总的系统资源消耗数的最小值，且第i个用户选择策略j。假设当前有n个待串行调度用户，每个用户可以使用A/B/C三种不同的调度策略，不同的策略会消耗不同的系统资源。对单个用户而言，不同的调度策略对系统资源的消耗可以归一化后抽象为数值。相邻的用户不能使用相同的调度策略，例如，第1个用户使用了A策略，则第2个用户只能使用B或者C策略。

2021-09-12 11:32:09 224

原创【100分】【We Are A Team】

c == 1 代表需要判定 a 和 b 的关系，如果 a 和 b 是一个团队，输出一行’we are a team’,如果不是，输出一行’we are not a team’c ==1,根据 a 和 b 是否在一个团队中输出一行字符串，在一个团队中输出‘we are a team‘,不在一个团队中输出’we are not a team’随后的 m 行，每行一条消息，消息格式为：a b c(1

2021-09-12 11:31:16 183

原创【100分】【运维日志排序】

首先，我们需要将输入的时间字符串转换成时间戳，并同时记录原始输入的索引。首先，我们需要将输入的时间字符串转换成时间戳，并同时记录原始输入的索引。接下来，我们对记录了时间戳和原始输入索引的列表进行排序，这样可以得到按时间升序排列的索引。接下来，我们对记录了时间戳和原始输入索引的列表进行排序，这样可以得到按时间升序排列的索引。最后，我们按照排序后的索引依次获取原始的时间字符串，即为按时间升序排序后的时间日志。最后，我们按照排序后的索引依次获取原始的时间字符串，即为按时间升序排序后的时间日志。

2021-09-12 11:30:16 285

原创数学智力题

一.数学基础进制及其应用1.找出有毒的酒 ????????2.状态切换 ????????3.工人与金条 ????4.确定灯泡的开关5.最后剩下的数概率1.中奖的概率2.两个实数和大于1的概率3.打开宝箱的概率4.随机选取m个查询 ????5.使用rand5实现rand7 ????排列与组合1.矩阵中A到B的走法 ????2.糖果的分法计算题1.容斥原理 ????二.智力题1.水果与标签 ????2.假币与损失3.黑白帽子 ????????4.囚犯猜帽子5

2021-09-12 11:20:54 139

原创【C++系列】C++常见面试题

一.变量1）全局变量与static变量？（作用域、生存周期）2）static函数与普通函数的区别？3）两个文件中声明两个同名变量？（使用了与未使用extern？）4）全局数组和局部数组的初始化？5）指针和引用的区别？（代表意义、内存占用、初始化、指向是否可改、能否为空）6）C/C++中的强制转换7）如何修改const变量、const与volatile8）静态类型获取与动态类型获取（typeid、dynamic_cast:转换目标类型必须是引用类型）9）如何比较浮点数大小？（直接使用==.

2021-09-12 10:35:08 136

原创【100分】【比赛】

这道题目需要我们计算得分最多的 3 位选手的编号，选手编号为 1 到 N，有 M 个评委对选手进行打分，打分规则为每个评委对选手打分，最高分为 10 分，最低分为 1 分。一个有N个选手参加比赛，选手编号为1~N（3

2021-09-12 10:33:49 3955

原创【计算机网络】常见面试题

一.理论1.应用层1）http协议与TCP联系？2）http/1.0和http/1.1的区别（非持久连接与持久连接、范围请求(断点续传)、缓存处理、更多状态码）3）http1.1和http2.0的区别？（二进制分帧层、服务端推送、首部压缩）4）http的请求方法有哪些？GET和POST的区别（获取资源与传输数据、额外参数的位置、支持的编码）5）http的状态码6）http和https的区别，由http升级为https需要做哪些操作？7）https的具体实现，怎么确保安全性？8）coo.

2021-09-12 10:32:02 65

原创【Linux操作系统系列】高级 I/O 函数

文章目录高级 I/O 函数pipedup 和 dup2readv 和 writevsendfilemmap 和 munmapspliceteefcntl高级 I/O 函数pipe#include <unistd.h>// fd[2] 两个 int 函数的数组指针int pipe(int fd[2]);创建一个管道，以实现进程间通信fd[0] 和 fd[1] 分别构成管道的两端，往 fd[1] 写入的数据从 fd[0] 读出（单向）若要实现双向数据传输，应该使用两个管道默认情

2021-09-11 14:34:21 148

原创【计算机网络】Linux 网络编程基础 API（下）

文章目录Linux 网络编程基础 API数据读写TCP 数据读写UDP 数据读写通用数据读写带外标记地址信息函数socket 选项网络信息 APILinux 网络编程基础 API数据读写TCP 数据读写#include <sys/types.h>#include <sys/socket.h>ssize_t recv(int sockfd, void *buf, size_t len, int flags);ssize_t send(int sockfd, const v

2021-09-11 14:32:37 79

原创【计算机网络】Linux 网络编程基础 API（上）

文章目录Linux 网络编程基础 APISocket 地址 API创建 socket命名 socket监听 socket接受连接发起连接关闭连接Linux 网络编程基础 APISocket 地址 API字节序大端字节序（网络字节序）：一个整数的高位字节（2331bit）存储在内存的低地址处，低位字节（07bit）存储在内存的高地址处小端字节序（主机字节序）：整数的高位字节存储在内存的高地址处，低位字节存储在内存的低地址处，现在 PC 常用socket 网络编程接口中标识 socket 地

2021-09-11 14:31:26 200

R语言研究美国人对不同的巧克力的喜爱程度数据报告

摘要：采用R语言作为研究工具，研究美国人对不同的巧克力的喜爱程度，巧克力不同口味的多样性、平衡、强度和纯度都是影响美国人对巧克力的喜爱。因此，并不是所有的巧克力美国人都是一样喜爱的。本次数据分析基于1,700 多个巧克力的专家评级，以及有关其区域来源、可可百分比、使用的巧克力豆种类和豆子的种植地点的信息的数据集进行分析。分析结果表明，椰子百分比是一个影响美国人喜欢的重要变量，巧克力喜爱度是随着时间的推移而提高的。数据集已从Kaggle存储库中获取。来源：https://www.kaggle.com/rtatman/chocolate-bar-ratings 巧克力的评分分为1到5分从结果中我们可以得出关于研究问题的结论。 1、影响巧克力棒评级的最重要变量是什么？从随机森林模型中，我们可以看到椰子百分比是一个重要的变量，MSE和REF的百分比增加是纯度增加的一个重要变量 2、巧克力评分是否随着时间的推移而提高？从平均评分与时间的关系图中，我们可以看到，评分随着时间的推移越来越高。我们还可以从线性回归中看出，时间的增加有助于评分的增加。 3、可可豆百分比如何影响巧克力的等级？从

2024-02-19

R 语言鲍鱼年龄预测数据报告

本次数据分析的目的的对鲍鱼年龄的进行预测。我们正在进行鲍鱼年龄的预测分析。鲍鱼是贝类之一，在美食界备受青睐。确定鲍鱼的年龄是一项挑战，因为其大小不仅受年龄影响，还受到食物供应等多种因素的影响。通常，人们会通过显微镜计算鲍鱼贝壳的环数来估算其年龄，但这种方法成本高且不够普及。我们的目标是找到最佳的指标来预测鲍鱼的环数，从而推断其年龄。这项数据分析旨在解决这一复杂的年龄预测问题。R本次数据分析旨在预测鲍鱼年龄。我们使用了线性全模型和逐步回归模型，并根据AIC最小化选择了逐步回归模型作为最佳模型。该模型对测试集进行了预测，表现良好。线性模型在这个研究课题中非常适用，拟合效果优秀。我们通过绘制每个变量与因变量的关系图，清晰展示了数据之间的相关性，使我们更容易观察鲍鱼年龄预测在餐饮业中的重要意义，为餐饮业的发展提供了推动力。

2024-02-19

R语言 NBA球员薪金分析报告

摘要: 对NBA球员薪金的影响因素的研究，可以更客观的分析出球员的签约或交易价值，这对于球队成绩、运营和盈利来讲都有重要的意义。数据来源某篮球网站2017-18赛季397名球员的薪金及多项数据指标，通过描述分析和建模分析以探究球员薪金的影响因素,基于多元线性模型，显著性的因素分别有场均时间，进攻能力，是否入选过全明星，球队胜率高，是球员薪金的重要影响因素。本案例使用对2017-18赛季397名球员的薪金及多项数据指标数据，通过描述分析和建模分析以探究球员薪金的影响因素,基于多元线性模型和决策树，显著性的因素分别有场均时间，进攻能力，是否入选过全明星，球队胜率高，是球员薪金的重要影响因素。由于球员的薪金的影响因素有很多,因此再未来的研究中可以考虑在模型中加入更多因素,比如三分能力，罚球能力，场均得分等。另外,若要将模型推广到东西部,还要进一步考虑东西部特有因素(如:在城市是否为发达等)。

2024-02-18

R 语言shiny 仪表板加报告

我们的数据集包含27,820个总体观察和以下12个变量：country（国家名称）、year（表示年份）、sex（按两性分类）、age（按年龄分类）、suicides_no（自杀人数）、population（人口数量）、suicides_100k_pop（每10万人口的自杀人数）、country_year（与年份相关的国家）、HDI_for_year（特定年份的人类发展指数分数）、gdp_for_year（特定年份的国内生产总值分数）、gdp_per_capita（人均国内生产总值分数）、generation（世代的名称）。一个重要的事实需要注意的是，这个数据集不包含所有国家的信息，因此我们的发现仅涉及该数据集中的国家。这个数据可在这里找到：https://www.kaggle.com/russellyates88/suicide-rates-overview-1985-to-2016 我们开发了一个交互式仪表板，以揭示全球101个国家的自杀人数以及它是如何受到年龄、世代和国内生产总值等因素的影响的。该仪表板旨在提供对连接经济背景上更大线索的聚合的高水平推理。该应用提供了以下内容

2024-02-18

安居客二手房爬虫加数据分析加报告 python

在代码中，实现了使用Python爬取安居客房产网站上的房屋信息，并将数据存储到一个数据集中。具体而言，代码使用requests库向安居客网站发送请求，然后使用lxml库解析响应的HTML文档，并从中提取出各个房屋的信息。本章主要围绕房地产数据展开，通过数据预处理、数据可视化和机器学习建模等步骤，对房价进行预测和分析。在数据预处理阶段，我们对数据进行了清洗和转换，包括缺失值处理、异常值处理、重复值处理以及特征工程等操作。在数据可视化阶段，我们通过散点图、箱线图、相关系数矩阵热力图等方式，分析了不同属性之间的关系。在机器学习建模阶段，我们选择了线性回归、决策树和随机森林三种模型进行训练和预测，并且通过均方误差和决定系数等指标进行了模型性能评估。最后，我们利用随机森林模型计算了各自变量的重要性，并用条形图展示了变量重要性排名。

2024-02-18

深度学习实战-电商产品评论的情感分析

"深度学习实战-电商产品评论的情感分析" 看起来是一个深度学习实践项目的标题，主要目标是通过深度学习技术对电商产品评论进行情感分析。在这样的项目中，通常会使用自然语言处理（NLP）和深度学习模型来识别文本中的情感倾向，例如判断评论是积极的、消极的还是中性的。项目可能包括以下主要步骤： 1. **数据收集：** 获取电商产品评论的数据集，可能涵盖多个产品类别和用户评论。 2. **数据预处理：** 对评论文本进行清理和预处理，包括分词、去除停用词、词干提取等，以便输入深度学习模型。 3. **标签处理：** 对评论进行标签化，即为每个评论分配情感标签（积极、消极、中性）。 4. **模型构建：** 使用深度学习模型，例如循环神经网络（RNN）、长短时记忆网络（LSTM）、或者更先进的模型如Transformer，以学习评论文本中的情感信息。 5. **模型训练：** 使用标注好的评论数据，训练深度学习模型以学习情感分析任务。 6. **评估模型：** 使用独立的测试集评估模型的性能，例如准确率、精确度、召回率等指标。

2024-02-17

19 - Tensorflow'实现识别中文数字项目

这个项目是一个使用TensorFlow和Keras构建的图像分类项目，旨在识别中文数字。以下是对项目的描述以及数据处理的概述： 1. **项目描述：** - 该项目旨在通过深度学习技术，使用TensorFlow和Keras框架，构建一个图像分类模型，专门用于识别中文数字。 - 图像分类是机器学习领域的一个常见任务，该项目通过训练神经网络，使其能够准确地识别手写的中文数字。 2. **数据读取与预处理：** - 数据集包含两部分：一个CSV文件（`chinese_mnist.csv`）和图像文件夹（`./dataset/data/data`）。 - CSV文件中存储了图像文件名的后缀数字与正确标签的映射关系。 - 图像数据被加载、转换为RGB格式，并进行归一化处理（将像素值除以255）。 - 图像的标签根据文件名映射到CSV文件中相应的suite_id、sample_id和code来获取。 3. **模型训练：** - 使用Keras的Sequential API搭建神经网络模型。 - 模型包括两个具有ReLU激活函数的全连接层，以及

2024-02-17

R语言基于SRUC本科生和硕士生的调查结果数据报告

这份报告基于SRUC本科生和硕士生的调查结果。其目的是选择适当的数据来回答三个具体的研究问题，提供合适的数据摘要，并进行并解释三种不同而相关的统计测试。该数据集包含定量和定性信息，涵盖了饮食习惯、参与体育活动和消费模式等方面。这三个研究课题的综合，深入探讨了学生生活方式和行为的各个方面，揭示了关于他们与健康相关选择的深层见解。通过剖析体育参与与咖啡消费、饮食与健身评级，以及性别差异在饮酒方面的关系，该研究揭示了身体活动、饮食习惯、性别和健康行为之间错综复杂的相互作用。这些发现对制定有针对性的干预和全面的健康教育计划具有重要意义。此外，它们强调了认识个体选择和行为上多方面影响的重要性。通过全面的理解，我们可以为未来旨在促进学生群体及其他人群更健康生活方式的研究和倡议铺平道路。

2024-02-17

python电商异常订单检测

异常订单是指在订单买卖过程中滥用买方权益的行为，如库存不付款、小件退货掉期等，商家在接到此类订单时无需恐慌。该平台是基于对底层大数据的分析，在买家的历史行为，以及当前交易的异常等维度停止判断后，推送疑似异常的订单并不一定存在风险。异常订单的风险存在很多风险，比如物流单号重复使用，退货与退货订单中的货物没有区别，退货物流地址不是门店退货地址，退货数量与实际下单数量不一致，没有退货物流记录。因投诉知识产权和被盗图片被拍到复仇，因商业纠纷被拍到复仇，被拍到同行攻击被拍到，定价错误，大量被拍到，未收到确认退款的商品。对于非真实消费需求，付款(未送达)后立即退款，补丁付款(未送达)全额减免后申请部分退款，非真实消费需求，交付后立即申请退款。因此，预测出订单是否异常是一个很重要的任务。本项目是针对电商平台交易数据的异常订单预测，数据来源于互联网。项目的分析目标是根据用户在平台的交易数据，基于Python进行数据分析，基于机器学习模型预测订单是否异常。

2024-02-17

R语言白酒质量预测分析

分析的目标是通过白酒的特征属性指标预测白酒的质量。这一目标将通过以下八个步骤来实现： 1.导入原始数据并对数据集中的变量进行分析，以充分了解每个变量。 2.处理缺失值，个别删除缺失值较少的变量，并对缺失值较多的变量进行多重插补，得到缺失值处理完毕的数据集。 3.去除重复值，得到新数据集。 4.进行异常值检测，保留删除异常点的数据集。 5.将数据分别构造成测试集和训练集。 6.对训练集进行重要变量选择，试图找出影响白酒价格的因素，包括白酒属性和风险指标。 7.将各变量转化为数值型变量，并对数值型数据进行相关性分析。 8.建立分类模型，对训练集进行模型验证。本文章是通过对白酒质量数据进行数据分析，可视化和数据建模，其中得出结论，和白酒质量最相关的变量是酒精，同时基于决策树和随机森林模型，对数据进行了预测，决策树模型在测试集的预测正确率是54.64%，随机森林模型在测试集的预测正确率是60.2%。

2024-02-17

本项目的目标基于给出的实验数据集，寻找影响客户流失的因素，然后基于机器学习的模型预测客户流失的情况 python

从以上模型中，我们可以说逻辑回归模型比其他模型表现得更好。针对此研究，如果用户的联系少了，每一个月的花费比较多，那么流水的可能性比较大。资费敏感的客户可能会由于运营商提供的资费过于昂贵，或者强制被捆绑购买了不需要的套餐或服务而导致流失，转投向资费更便宜实惠的运营商。由于电信运营商的服务水平造成的客户流失反映在客户投诉上，运营商是否及时对客户的投诉信息进行处理，处理结果是否令客户满意极大影响着客户是否流失。客户流失预测研究最大的目的在于为营销部门提供有效的营销方案。对于不同原因流失的客户，企业应当采取不同的营销策略，对其进行挽留，以达到资源节约，效益最大的目的。具体针对措施如下： 1.对于资费敏感的客户，可进行话费赠送或优惠充值的活动，降低资费，挽留客户。 2对于由于服务原因流失的客户，运营商应该对这类客户进行充分的调研，了解客户的需求，最大程度地满足客户的需求。

2024-02-17

R语言线性回归预测电影评分报告

摘要: 国产电影质量越来越好，近些年来，我们能够肉眼可见国产电影的进步。不管是战狼系列，唐人街探案系列，还是今年春节档的系列电影。都得到了观众极高的评分，除此之外，在动画电影这方面，我国也取得了喜人的成绩。不管是特效还是故事，国产电影都变得日益丰满了。我们在某网站抓取了千条数据，试图通过对这些数据的分析，找出电影受欢迎的因素。结果表明了，中国大陆,汉语,上映年份和评价人数是影响电影评分的主要原因。我们在某网站抓取了1810条数据，试图通过对这些数据的分析，找出电影受欢迎的因素。通过线性回归模型的表现结果，表明了中国大陆,汉语,上映年份和评价人数是影响电影评分的主要原因。但是对于线性模型的R2非常的低，因此不能预测电影评分，需要再采集更多是数据进行预测电影评分，比如电影的剧情，可以做对应的编码处理。由于电影评分的影响因素有很多,因此再未来的研究中可以考虑在模型中加入更多因素,比如电影的时长，电影的票房等等。

2024-02-17

R语言基于OME数据集的统计分析和解读

这个数据集主要是针对患有中耳积液（OME）的儿童进行的听觉感知测试。实验通过在一对扬声器中播放宽频噪声，并在其中一个声道上添加一个信号，被试需要将头转向添加信号的声道。信号可以是一段时间内噪声幅度增加的连贯信号，也可以是同样时间内添加的独立噪声以产生相同的功率增加的不连贯信号。在原始分析中，使用的阈值是获得75%正确回答所需的刺激音量。其中一些儿童曾患有中耳积液（OME）。根据我们的实验结果，我们比较了不同机器学习模型在测试集上的准确率。结果如下： - 初始决策树模型和剪枝决策树模型的准确率相同，均为0.678。这意味着决策树模型在预测测试样本时表现稳定，但准确率相对较低。 - BP神经网络模型在测试集上表现出较高的准确率，为0.738。这表明神经网络模型具有一定的预测能力，并能够较准确地对测试样本进行分类。 - 线性可分SVM模型和线性不可分SVM模型在测试集上的准确率相同，均为0.738。这说明SVM模型在这个数据集上的线性可分性对准确率的影响不大。综上所述，从测试集准确率来看，BP神经网络模型在本次实验中表现最佳，而决策树模型和SVM模型的准确率相对较低。然而，选择最佳模型

2024-02-17

在R中对首尔自行车共享需求数据进行回归分析进行模型分析，以预测每小时所需自行车的数量

简介：数据集的背景/动机目前，租赁自行车在许多主要城市中得到推广，以提高出行的便利性和环保交通。将租赁自行车在正确的时间提供给公众并使其易于获取是重要的，因为这可以减少等待时间。最终，为城市提供稳定供应的租赁自行车是一个主要关注点。有许多因素，如温度、时间、假期、季节等，可能会影响自行车的可用性。关键部分是预测每小时所需自行车的数量，以实现租赁自行车的稳定供应。一篇关于首尔自行车共享需求预测的基于规则的模型使用天气数据[1]，使用了两个数据集 - 首尔自行车和首都自行车共享计划。它呈现了使用重复交叉验证方法和测试集进行评估的优化超参数训练的5个统计模型的结果：(a) CUBIST (b) 正则化随机森林 (c) 分类与回归树 (d) K最近邻 (e) 条件推断树。使用多个评估指标，如R2、均方根误差、平均绝对误差和变异系数，来衡量回归模型的预测性能。结果显示，基于规则的CUBIST模型能够在首尔自行车的测试集中解释约95%的方差（R2）。进行了变量重要性分析，以分析所有开发模型的最重要变量，结果显示温度和一天中的小时是每小时租赁自行车需求预测中最有影响力的变量。 Cubist模型基

2024-02-16

R 语言报告七种干豆类型预测分类

数据来源于UCI数据库，网址是https://archive.ics.uci.edu/ml/datasets/Dry+Bean+Dataset/，数据为Dry_Bean_Dataset.xlsx数据集(下载下来格式xlsx)。该数据集共13661条数据，17个变量，具体变量名及含义如下表所示。七个不同类别的干豆在16个特征是差异，其中BOMBAY 类别的干豆在很多的特征比较大， 16个特征根据箱型图分布来看，七个不同类别的干豆都是存在一定的差异根据变量重要性曲线可知ShapeFactor4 (特性形状4)、roundness (圆度)较为重要总的来说，SVM相对随机森林模型更准确更好，应用SVM模型进行预测七种干豆的类别。聚类一共划分了7类，对应每类的样本数量分别是2725 ，1586 ，1877 ，2118 521 ，2776 ，2008（设置随机种子1234的结果）

2024-02-16

基于豆瓣书籍信息的文本聚类与主题分析

本论文基于豆瓣网站上的书籍信息，采用文本聚类与主题分析的方法，旨在通过文本特征提取和机器学习技术，对书籍进行聚类分析，以揭示不同主题和内容的书籍之间的关联和相似性。在预处理阶段，利用中文分词工具jieba对文本进行分词，并去除长度为1的词汇以及常见的停用词。随后，构建了TF-IDF矩阵，用于表示文本的特征。选取K-means聚类算法对文本数据进行聚类，并通过关键特征的提取，将书籍划分为不同的聚类簇。最终，得到了三个聚类簇，分别涉及与产品设计与用户体验、中国社会发展与历史、小说作品与生活故事相关的书籍。这些聚类结果可以为读者提供更快速的书籍搜索和推荐，且有助于深入探索不同领域的知识和文化。本研究的结果为文本聚类在图书领域的应用提供了实证研究，并为进一步优化聚类算法和拓展语料库范围的研究提供了参考和启示。 Cluster 1 包含了与设计、产品、用户、体验、交互和学习相关的关键特征，可能涉及与产品设计、用户体验和交互设计等方面相关的书籍。Cluster 2 包含了与作者、中国、社会、历史和发展相关的关键特征，可能涉及与作者、中国社会、历史和发展等方面相关的书籍。Cluster 3 包含了

2024-02-16

教育婚姻匹配与婚姻满意度

文章利用 2018 年中国家庭追踪调查数据（CFPS），采用对角参照模型分析教育婚姻匹配模式对夫妻婚姻满意度的影响。研究发现：（1）受教育程度越高的同质婚，夫妻婚姻满意度越高；（2）妻子比丈夫学历高会显著降低双方的婚姻满意度；（3）夫妻的学历差距对各自婚姻满意度的影响存在差异，妻子受教育程度高于丈夫的幅度越大，婚姻满意度越低，而略低于丈夫则会显著增加妻子的婚姻满意度；丈夫受教育程度低于妻子 2 个等级及以上会显著降低其婚姻满意度。随着教育获得性别差异的逆转，越来越多的年轻女性学历高于男性，婚姻匹配中的女高男低现象将不断增加，婚姻稳定性将会面临更大挑战。

2024-02-16

背景知识本节课用详细讲解如何用R语言和线性时间序列模型分析实际数据，并展现线性时间序列模型的适用性与局限性数据为： •19

背景知识本节课用详细讲解如何用R语言和线性时间序列模型分析实际数据，并展现线性时间序列模型的适用性与局限性。数据为： •1997-01-06到2010-09-27的美国普通汽油价格周数据；这些数据是持续更新的，也反映了全球或美国经济的重要方面，其建模问题有足够的代表性。用时间序列分析或者统计方法建模时，最常遇到的困难是如何选取一个适当的模型。当数据之间的动态相依性很复杂时，模型的形式难以确定；当有多个模型都表现很好时，模型难以选择。时间序列数据建模的一些指导原则： •数据仅是可利用信息的一部分， •专业知识、常识、历史事件等都是需要考虑的可利用信息。 •多个模型可能表现相近，这时并没有一个”正确的”模型，选择一个就可以。在预测时，可以结合多个模型来改善预测效果。建模的过程是从最简单的模型到逐步复杂，千万不能以为理论上越复杂、理解和掌握的人数越少的模型才是越好的模型。模型应尽可能选择更简洁的模型，如果两个模型的表现相近，一定要选择更简单的一个。这也是避免过度拟合的要求。过度拟合会导致模型的外推预测能力丧失。探索性分析原油价格和汽油价格对美国经济的重要影响： •

2024-02-16

根据学习数据集建立房屋价格对数值logprice的预测模型，包括线性模型、Lasso模型、神经网络模型、决策树模型

根据学习数据集建立房屋价格对数值logprice的预测模型，包括线性模型、Lasso模型、神经网络模型、决策树模型（交叉验证修剪）、决策树模型（验证数据集修剪）、袋装决策树模型、梯度提升决策树模型、随机森林模型（默认参数）、随机森林模型（选择参数）和贝叶斯可加回归树模型。再将这些模型应用于测试数据集，获取房屋价格对数值的预测值，转换为房屋价格的预测值。 (1)设立并初始化记录所有模型的均方根误差的数据框rmse.allmodels。 (2)将数据框的行名设为各个模型的名字。 4.建立模型 (1)线性模型 ①　根据学习数据集建立线性模型。 ②　将将线性模型应用于测试数据集，获取房屋价格对数值的预测值。 ③　计算线性模型预测测试数据集房屋价格的均方根误差。 ④　将线性模型存储在本地目录下。 (2)Lasso模型 ①　使用交叉验证选择调节参数lambda的最佳值。 ②　将Lasso模型应用于测试数据集，获取房屋价格对数值的预测值，转换为房屋价格的预测值。 ③　计算Lasso模型预测测试数据集房屋价格的均方根误差。 ④　将Lasso模型存储在本地目录下。 (3)神经网络模型 ①　复制一份学习数

2024-02-16

《人工智能项目实习》 z作业爬取链家网站中列出的兰州并.形成热力图

2.利用网络爬虫爬取数据（1）利用网络爬虫技术，爬取链家网站中列出的兰州的二手房租房信息，爬取时间为 2012 年 11 月 30 日-2022 年 11 月 30 日，爬取的信息包括所属区域、小区名称、价格、面积、户型；（2）将爬取的数据下载到本地，并保存在“链家兰州租房数据.csv”文件中。 3.数据预处理（1）数据预处理的第一步是缺失值和重复值的检查和处理，将爬取的“链家兰州租房数据.csv”数据中检测出的缺失值和重复值进行删除处理；（2）将“面积（m2 ）”一列的数据类型转换成 float 类型，将“户型”一列数据统一显示为“*室*厅”。 4.形成热力图（1）打开 http://lbsyun.baidu.com/进入百度地图开放平台，注册并登录账号（若已申请百度账号，可直接登录），滚动至首页底部点击“申请秘钥”，注册称为开发者（申请秘钥时，填写的应用名称为“租房信息”，应用类型为“服务端”，并设置 IP 白名单为“0.0.0.0/0”）；（2）将“区域”和“小区名称”两列数据进行拼接，作为 DataFrame 对象新增列“位置”对应的数据；（3）将

2024-02-16

R 语言波士顿房价数据分析报告

分析目标：建立回归模型，试图找出影响波士顿房价的因素，预测波士顿房价的预期走势，为人们购房提供资料支持。由相关性分析可得，LSTAT、RM、PTRATIO、INDUS等自变量与房价的相关性比较大，但是如果想要得到更准确的预测结果还需要其他变量参与。分析过程要紧跟着数据分析目标，切合问题解决需求。从结果中可以看出，将变量进行分类、去除不重要变量等的测试结果比未去除的测试结果要好。但是，预测结果有误差，可能是自变量与因变量的相关性不够高、考虑的自变量数目较少、数据的样本量较少等原因，不足之处还有待改进。

2024-02-16

基于深圳二手房房价的回归预测研究 python

基于深圳二手房房价的回归预测研究 1 研究问题及意义 1.1研究问题本文根据最新的“深圳二手房房价数据集”找到影响二手房房价的主要因素，预测未来的二手房房价情况，且目标变量为平米单价，这属于回归预测问题。 1.2目标变量 per_price（平米单价） 1.3研究意义本研究以深圳二手房房价数据为研究对象，旨在通过对数据的清洗和处理，找出影响二手房价的主要因素，并基于多元回归模型对未来的二手房价走势进行预测。通过本研究，我们不仅了解了影响二手房价的因素，还能够更准确地预测未来的房价走势，为我们购买二手房提供了重要的参考。此外，本研究也为房地产市场的未来发展提供了重要的科学依据。在实际应用中，本研究的结果可以为政府决策者、房地产开发商和投资者提供有关二手房价走势的重要信息，帮助他们做出更明智的决策。例如，政府决策者可以根据本研究的结果，制定更加科学的房地产政策；房地产开发商可以根据本研究的结果，决定在哪些地区进行开发；投资者可以根据本研究的结果，决定是否进行房地产投资。总的来说，本研究对于了解影响房价的因素和预测未来房价走势具有重要的现实意义。它不仅对于房地产市场的发展有积极的贡

2024-02-16

51job大数据类职业分析报告 python

综合分析：综上所述，大数据类岗位在北、上、广、深、杭，的需求量远远超过其他城市，谋求发展，其中数深圳的平均薪资水平最高，想做大数据类岗位，深圳是不二的选择。行业内需求3-4年与5-7年经验的程序员最多，技术强、熟练的大数据岗位空缺较大，行业上升空间很足。在软件行业中，大数据类岗位需求量位居第五，需求量不过java岗位的三分之一，且创业公司、外资企业和民营企业为大数据岗位的核心企业，大数据岗位更多来自体量不大的公司与外企公司，且沿海城市的平均薪资普遍高于内陆城市。

2024-02-16

R语言预测客户对电话营销活动的反应

该项目将使该银行能够更细致地了解其客户群，预测客户对其电话营销活动的反应。通过分析客户特征，如人口统计和交易历史，银行将预测客户的储蓄行为，并确定哪种类型的客户更有可能进行定期存款然后，银行可以将其市场工作重点放在这些客户身上。这将使银行能够更有效地确保存款，并通过减少特定客户的不需要的广告来提高客户满意度。数据集包含 17 列和 45211 个观测值。它具有数字和类别变量。数据集中没有缺失和重复的值。数据集非常干净和结构化。结果可变存款通常是倾斜的。属性信息： 1.Age: 年龄 2.Job: 工作类型 3.Marital: 婚姻状况（分类：“离婚”，“已婚”，“单身”） 4.Education: 教育 Default: 违约：是否违约

2024-02-16

R 语言葡萄牙银行数据研究报告

数据源和数据集信息：该数据集与葡萄牙银行机构的营销活动相关。此数据是从 UCI 机器学习存储库中获取的。下载链接 https://archive.ics.uci.edu/ml/datasets/bank+marketing 在这个项目中，对葡萄牙银行营销数据实施了机器学习技术，并试图了解影响定期存款订阅的因素。已实现二分类算法，分别是决策树和随机森林。随机森林模型告诉了：age, balance, month, day, job 和poutcome等变量对预测是否订阅存款是非常重要的变量。对于本次的项目，当然要存在很多的局限性，比如数据集中并没有做去除异常值的操作，分类模型的正确率有待进一步提高。敏感性比较低，需要进一步提高，因此需要采集更多的数据(主要是输出变量属于”是”)的类型。

2024-02-16

本系统最主要是对未上映的电影进行评分预测，给予消费者更多的权益

本项目以电影数据为主题，基于hadoop伪分布式搭建，结合hive数据仓库调用物理机mysql数据库实现电影相关数据统计、通过Mapreduce编程对hdfs文件系统的文件进行词频统计。使用python进行电影数据采集、处理、分析及数据可视化，融合了python爬虫，Matplotlib绘图、Echarts数据可视化、情感分析、词图云等多个功能，可实现百万级电影数据离线处理与计算。这次小组作业我们巩固了前面学习的Hadoop环境搭建、mysql数据库相关知识，在此基础上对hive数据仓库、mapreduce工作原理进行学习。通过本次作业我们也学习到了一些linux系统的安装、基本使用、系统架构以及一些常见命令的使用等。通过小组学习，我们各有分工，相互协作，加深了对彼此的了解，学到新的知识。

2024-02-16

无人机建图与定位视觉SLAM：根据一张张连续的图像（它们形成了一段视频），从中推断相机的运动，以及周围环境的情况

无人机建图与定位视觉SLAM：根据一张张连续的图像（它们形成了一段视频），从中推断相机的运动，以及周围环境的情况。（有点像光流的思路）把完整的SLAM系统分为几个模块：前端视觉里程计、后端非线性优化、建图、回环检测。 VO能够通过相邻帧间的图像估计相机运动，并恢复场景的空间结构。称它为“里程计”是因为它和实际的里程计一样，只计算相邻时刻的运动，而和再往前的过去的信息没有关联。假定我们已有了一个里程计，估计了两张图像间的相机运动。那么，只要把相邻时刻的运行“串”起来，就构成了机器人的运动轨迹，从而解决了定位问题。仅通过视觉里程计来估计轨迹，将不可避免地出现累计漂移（Accumulating Drift）。由于每次估计都带有一定的误差，由于里程计的工作方式，先前时刻的误差将会传递到下一时刻。为了解决漂移问题，我们还需要两种技术。后端优化和回环检测。回环检测负责把“机器人回到原始位置”的事情检测出来，而后端优化则根据该信息，校正整个轨迹的形状。笼统地说：后端优化主要指处理SLAM过程中噪声的问题。这个状态估计的不确定性有多大----这称为最大后验概率估计。这里的状态既包括

2024-02-16

https://archive.ics.uci.edu/ml/datasets/bank+marketing R语言论文

银行产品的营销是指在实现组织目标的前提下，保持提供服务的整体能力，以满足客户的金融需求，超过竞争对手。银行业是一个以定制服务为导向的行业，因此应提供能够有效、专业、有利可图地满足客户需求的服务。营销战略包括分类、响应和有效地满足客户的需求和愿望。银行的主要职责不仅是获取和赢得越来越多的客户，还要为他们提供最佳的服务。数据源和数据集信息该数据集与葡萄牙银行机构的营销活动相关。此数据是从 UCI 机器学习存储库中获取的。友情链接： https://archive.ics.uci.edu/ml/datasets/bank+marketing 营销活动以电话为基础。通常，需要与同一客户进行多次联系，以便访问产品（银行定期存款）是（“是”）还是不会（“否”）订阅。

2024-02-16

R语言结课分析报告：最高和最低气温估计

最高温度是一定时段内温度的最高值。常用的有日最高温度、月最高温度和年极端最高温度。气象学中的最高温度一般是指一定时段内温度的最高值。最低气温是指在一定时间或一定空间内空气温度的最低值。本R数据分析的目的即是对第二天最高和最低气温进行预测。二、数据说明（一）数据来源这些数据旨在修正韩国气象局在韩国首尔上空运行的LDAPS模型第二天最高和最低气温预测。这些数据包括 2013 年至 2017 年的夏季数据。输入数据主要由 LDAPS 模型的下一天预测数据、现位最高和最小温度以及地理辅助变量组成。此数据中有两个输出（即第二天最高和最低空气温度）。Hindcast 验证于 2015 年至 2017 年期间进行。（二）变量说明 1. 对变量进行说明 Present_Tmax - 当日（°C）最高气温在0至21小时之间：20至37.64度。Present_Tmin - 当日最低气温在0至21小时（°C）：11.3至29.95。 LDAPS_RHmin - LDAPS 模型预测第二天最小相对湿度（%）：19.8 到 98.56。LDAPS_RHmax - LDAPS 模型预测第二天最大相对

2024-02-16

基于一个docx 实现的问答系统关于发射系统故障的分析与处理的内容，python方向

file_path = 'CC雷达.doc' ques_and_answer = project(file_path) 回下下面内容 query = ['CC雷达伺服分系统是什么', '天线方位或仰角定位不准，怎么维修？', '伺服不能启动，咋整？', '可控硅风机怎么办', '冷却开关脱扣处理方法', '俯仰电源故障21#故障解决办法', '俯仰电源故障16#故障问题出在哪里', '控制按钮坏了，咋整？', '譬如秋风忽至，再有一场早霜', '我才想到，当年我总是独自跑到地坛去，曾经给母亲出了一个怎样的难题。', '你中午吃的什么？']

2024-02-16

题目：点菜管理信息系统参考论文

1内容及要求设计内容：设计一个点菜管理信息系统。设计要求： 1.对数据库系统进行需求分析 2.设计概念结构、逻辑结构、物理结构。 3.实现后端的数据库设计。 4.搭建前端应用，与后端的数据库进行连接。 5.实现前端应用的各个功能与模块，实现一个完整的应用软件。 6.撰写课程设计报告书。 2系统环境选择数据库系统选择：Microsoft SQL Server 2019 数据库管理系统选择：Microsoft SQL Server Management Studio 18 前端开发语言选择：C# 前端开发软件：Visual Studio 2019 前端开发框架：Windows 窗体应用(.NET Framework 4.8) 一、需求分析 1.1设计背景互联网的运用渗透到了我们日常生活中，使用手机进行外卖点餐的操作也越来越常见。在一些餐饮店铺中，用户可以在店内扫描桌上的二维码进行点餐，也可以足不出户下单一个外卖订单。2020年，在江苏大学校内的食堂也提供了类似的服务。学生可以在食堂内直接点餐，也可以通过“爽提”这一外卖平台进行校内的外卖订购服务。本次课程设计与常见的点菜信息管理系

2024-02-16

R语言课程结课论文题目预测明天是否下雨

分析的目标：根据当前的天气形势，对未来一定时期内的天气状况进行预测。结合有关气象资料、当天的天气气温，气压等属性来预测第二天是否下雨。第一，导入原始数据后，对数据集中的变量进行分析，充分了解每个变量。第二，对缺失值较少的变量进行个别行删除得到处理完毕后的数据集。第三，对数据集进行进行异常值检测，保留删除异常点的数据集。第四，对数值型数据进行相关性分析。第五，建立决策树模型，对训练集进行模型验证，之后，再对预测测试集结果保存。完成以上步骤后，能较为准确预测明天是否下雨，最终为人们在遇到相同问题时，提供完善资料的解决方法。

2024-02-16

客户流失，是指客户选择停止使用公司的产品或服务但对于每一位客户，通常都有早期的指标或指标可以通过客户流失分析发现

一、项目概况客户流失，是指客户选择停止使用公司的产品或服务。但对于每一位客户，通常都有早期的指标或指标可以通过客户流失分析发现。例如，电信行业面临着大量的客户流失（年流失率为15-25%），因为客户可以从各种服务提供商中选择，并积极地从现有服务提供商切换到其他服务提供商。同时查看业务运营洞察（例如，减少重复购买、减少购买数量）和客户体验洞察以及客户反馈是预测客户流失的基础。通常从商业角度来看，获得新客户的成本比保留现有客户的成本更高。为了减少客户流失，公司需要预测哪些客户面临高流失风险。检测潜在客户流失的早期迹象，洞察客户及其在众多渠道中的互动，包括门店访问、产品购买历史、客户服务电话、基于Web的交易和社交媒体互动。通过为客户流失提供解决方案，企业可以保持其市场地位，并随着更多的客户网络而发展壮大，启动成本越低，利润越大。本项目的目标基于给出的实验数据集，寻找影响客户流失的因素，然后基于机器学习的模型预测客户流失的情况。客户流失从经济上减少了公司的资金，并影响了公司的盈利能力。运营层面的分析将帮助管理层发现哪些部门或服务导致客户流失。在确定问题的基础上，可以实施大量策略来消除

2024-02-16

英超联赛球员爬虫数据分析：进球趋势、俱乐部火力对比与预测

使用seaborn和matplotlib库绘制多个数据可视化图表，包括散点图、箱型图、柱形图、饼图、折线图等，分析球员进球数、俱乐部总进球、各国家入选射手榜人次等信息。

2024-02-16

英超联赛球员爬虫数据分析：进球趋势、俱乐部火力对比与预测

2. 读取名为`result.csv`的数据文件，使用pandas库的`read_csv`函数。 3. 数据预处理，包括处理球员名字翻译更迭的问题，对特定球员属性进行修改。 4. 使用seaborn和matplotlib库绘制多个数据可视化图表，包括散点图、箱型图、柱形图、饼图、折线图等，分析球员进球数、俱乐部总进球、各国家入选射手榜人次等信息。 5. 进行线性回归分析，对指定球员（如萨拉赫、孙兴慜）进行2023赛季进球数的预测。 6. 利用WordCloud库生成球衣号的词云图，分析顶级射手的球衣号选择。 7. 分析曼城在2022年射手榜上的射手信息，绘制主要进攻火力分配的柱形图。

2024-01-25

17 - Tensorflow 实现推荐Din模型

这段代码实现了一个基于注意力机制的推荐模型，具体来说，它是一个DIN（Deep Interest Network）模型。以下是代码的简要介绍： 1. **数据准备部分**： - 生成了包含10000个用户和10个商品的随机用户行为数据。 - 将数据分为训练集（80%）和测试集（20%）。 2. **模型构建部分**： - 使用TensorFlow和Keras构建了一个DIN模型。 - 模型包括用户ID、商品ID和历史行为（这里设定长度为10）的输入。 - 使用Embedding层对用户和商品进行嵌入。 - 引入了DIN的注意力机制，通过对历史行为、用户嵌入和商品嵌入进行拼接和全连接操作来计算注意力权重。 - 输出层使用sigmoid激活函数进行二分类预测。 3. **模型训练部分**： - 使用训练集进行模型训练，随机生成标签用于训练。 - 使用Adam优化器和二分类交叉熵损失函数进行模型编译和训练。 4. **模型评估部分**： - 使用测试集评估模型性能，同样随机生成测试标签用于评估。 5. **点击率预测部分*

2024-01-24

15 - Tensorflow 实现Skip-Gram

Tensorflow 演示了一个简单的 Skip-Gram 模型，使用二进制交叉熵作为损失函数。。希望这能够帮助你理解 Skip-Gram 模型的实现和负对数似然损失函数的使用

2024-01-24

14 - Tensorflow 实现word2vec 连续词袋模型CBOW

Continuous Bag of Words（CBOW）是一种用于学习词嵌入的神经网络模型，属于Word2Vec框架的一部分。CBOW的目标是通过上下文中的词语来预测目标词语，具有简单的结构和高效的训练方式。本教程将带你深入了解CBOW模型的原理、实现和应用。

2024-01-23

Java 学生信息管理系统-期末大作业

Java 学生信息管理系统-期末大作业 # sms接口文档-V1.0 ## 1. 用户相关接口 ### 1.1 获取学生详细信息 #### 1.1.1 基本信息 > 请求路径：/student/userInfo > > 请求方式：GET > > 接口描述：该接口用于获取所有学生的信息 #### 1.1.2 请求参数无 #### 1.1.3 响应数据响应数据类型：application/json 响应参数说明： | 名称 | 类型 | 是否必须 | 默认值 | 备注 | 其他信息 | | ----------- | ------ | -------- | ------ | --------------------- | -------- | | code | number | 必须 | | 响应码, 0-成功,1-失败 | | | message | string | 非必须 | | 提示信息

2023-12-14

c++项目作业-基于easyx的小型公司工资管理系统

c++项目作业——基于easyx的小型公司工资管理系统

2023-12-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

R语言研究美国人对不同的巧克力的喜爱程度 数据报告

R 语言 鲍鱼年龄预测数据报告

R语言 NBA球员薪金 分析报告

R 语言shiny 仪表板加报告

安居客二手房爬虫加数据分析加报告 python

深度学习实战-电商产品评论的情感分析

19 - Tensorflow'实现识别中文数字项目

R语言基于SRUC本科生和硕士生的调查结果 数据报告

python电商异常订单检测

R语言白酒质量预测分析

本项目的目标基于给出的实验数据集，寻找影响客户流失的因素，然后基于机器学习的模型预测客户流失的情况 python

R语言 线性回归预测电影评分 报告

R语言基于OME数据集的统计分析和解读

在R中对首尔自行车共享需求数据进行回归分析 进行模型分析，以预测每小时所需自行车的数量

R 语言报告 七种干豆类型预测分类

基于豆瓣书籍信息的文本聚类与主题分析

教育婚姻匹配与婚姻满意度

背景知识 本节课用详细讲解如何用R语言和线性时间序列模型分析实际数据，并展现线性时间序列模型的适用性与局限性 数据为： •19

根据学习数据集建立房屋价格对数值logprice的预测模型，包括线性模型、Lasso模型、神经网络模型、决策树模型

《人工智能项目实习》 z作业 爬取链家网站中列出的兰州 并.形成热力图

R 语言波士顿房价数据分析报告

基于深圳二手房房价的回归预测研究 python

51job大数据类职业分析报告 python

R语言预测客户对电话营销活动的反应

R 语言葡萄牙 银行 数据 研究报告

本系统最主要是对未上映的电影进行评分预测，给予消费者更多的权益

无人机建图与定位 视觉SLAM：根据一张张连续的图像（它们形成了一段视频），从中推断相机的运动，以及周围环境的情况

https://archive.ics.uci.edu/ml/datasets/bank+marketing R语言论文

R语言结课分析报告： 最高和最低气温估计

基于一个docx 实现 的 问答系统关于 发射系统故障的分析与处理的 内容，python方向

题目：点菜管理信息系统 参考论文

R语言课程结课论文 题目预测明天是否下雨

客户流失，是指客户选择停止使用公司的产品或服务 但对于每一位客户，通常都有早期的指标或指标可以通过客户流失分析发现

英超联赛球员爬虫数据分析：进球趋势、俱乐部火力对比与预测

英超联赛球员爬虫数据分析：进球趋势、俱乐部火力对比与预测

17 - Tensorflow 实现 推荐Din模型

15 - Tensorflow 实现Skip-Gram

14 - Tensorflow 实现word2vec 连续词袋模型CBOW

Java 学生信息管理系统-期末大作业

c++项目作业-基于easyx的小型公司工资管理系统

空空如也

R语言研究美国人对不同的巧克力的喜爱程度数据报告

R 语言鲍鱼年龄预测数据报告

R语言 NBA球员薪金分析报告

R语言基于SRUC本科生和硕士生的调查结果数据报告

R语言线性回归预测电影评分报告

在R中对首尔自行车共享需求数据进行回归分析进行模型分析，以预测每小时所需自行车的数量

R 语言报告七种干豆类型预测分类

背景知识本节课用详细讲解如何用R语言和线性时间序列模型分析实际数据，并展现线性时间序列模型的适用性与局限性数据为： •19

《人工智能项目实习》 z作业爬取链家网站中列出的兰州并.形成热力图

R 语言葡萄牙银行数据研究报告

无人机建图与定位视觉SLAM：根据一张张连续的图像（它们形成了一段视频），从中推断相机的运动，以及周围环境的情况

R语言结课分析报告：最高和最低气温估计

基于一个docx 实现的问答系统关于发射系统故障的分析与处理的内容，python方向

题目：点菜管理信息系统参考论文

R语言课程结课论文题目预测明天是否下雨

客户流失，是指客户选择停止使用公司的产品或服务但对于每一位客户，通常都有早期的指标或指标可以通过客户流失分析发现

17 - Tensorflow 实现推荐Din模型