自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 资源 (15)
  • 收藏
  • 关注

原创 一张图解决IDEA、idea配置 Android SDK 问题

按照下图中的标号:点击④的 Edit 就跳转到SDK的下载界面了。

2020-07-25 00:11:35 1288 1

原创 java实现贪吃蛇小游戏---python吃掉了java

java实现贪吃蛇小游戏(bilibili视频还没审核完成,就不贴视频了,明天贴上游戏运行视频)----运行环境–jdk1.8、IDEA;源码需要请:点赞留言邮箱;主要代码如下:package pk.game.snake;import javax.swing.JFrame;public class Snake { public static void main(String[] args) { JFrame frame = new JFrame(); frame..

2020-07-24 23:13:23 807 1

原创 python+pygame实现打砖块小游戏--可以定义子弹速度、跳过关卡、增加关卡

python+pygame实现打砖块小游戏----可以定义球的速度,可以跳过关卡,也可以自己增加关卡:运行环境–python3.7、pycharm;源码需要请:点赞留言邮箱;只需改变main.py文件中的tick(100)方法中的参数,就可以实现改变球的速度。球速为100已经很快了: python+pygame实现打砖块小游戏 球速为20时: ..

2020-07-24 17:32:44 1417 18

原创 spring重点难点面试题---2020迎战spring

目录:1. 什么是spring?为什么要使用spring?2. Spring 核心包括哪几个方面?3. 什么是AOP?4. 如何实现AOP?5. AOP相关概念有哪些?6. AspectJ 注解有哪些并说明?7. Spring AOP 和 AspectJ AOP 有什么区别?8. Spring 中的 AOP 的底层实现原理是什么?9. 使用拦截器的优点是什么?10. Spring 通知类型有哪些?11. 什么是IoC?12. 为什么使用

2020-07-22 11:23:29 1336

原创 html5+javascript+css实现---网页版坦克大战---无需运行环境

html5+javascript+css实现—网页版坦克大战—无需运行环境,只需一个浏览器,重拾少年情。运行环境—除老版IE浏览器都可以;源码需要请:点赞留言邮箱;可以跳关,回退关卡。支持双人坦克大战… 坦克大战网页版 ...

2020-07-21 21:46:22 721 21

原创 使用html5+javascript+css实现单机版五子棋---跟电脑打没赢过

Html5+JavaScript+CSS实现单机版五子棋:运行环境—除了老版的IE浏览器,其他都行;源码需要请:点赞留言邮箱; html5实现五子棋

2020-07-21 21:40:21 539 7

原创 python+pygame实现坦克大战小游戏---可以自定义子弹速度

python+pygame实现坦克大战小游戏—可以自定义子弹速度:运行环境–python3.7、pycharm;源码需要请:点赞留言邮箱;正常版子弹速度: 普通速度版 加速版子弹速度: 子弹加速版 另外还有多种道具,支持两人一起玩。main()方法如下:.

2020-07-21 21:12:48 5922 87

原创 堆、栈、队列---对比学习

堆、栈对比:1、物理地址:①堆的物理地址分配对对象是不连续的。因此性能慢些;②栈使用的是数据结构中的栈,先进后出的原则,物理地址分配是连续的。所以性能快;2、内存分别:①堆因为是不连续的,所以分配的内存是在运行期确认的,因此大小不固定。一般堆大小远远大于栈;②栈是连续的,所以分配的内存大小要在编译期就确认,大小是固定的;3、存放的内容:①堆存放的是对象的实例和数组。因此该区更关注的是数据的存储;②栈存放:局部变量,操作数栈,返回结果。该区更关注的是程序方法的执行;4、程序的可见度:①.

2020-07-21 10:50:24 929

原创 JVM面试题---2020迎战java虚拟机

目录:1. 什么是并发?并发与并行有什么区别?2. 什么是并发编程?为什么不叫并行编程?3. 为什么要使用并发编程?并发编程的优点是什么?4. 并发编程的缺点?5. 并发编程三要素?6. 线程的安全性问题体现在哪几个方面?7. 如何解决线程的安全性问题?8. 什么是进程?9. 什么是线程?10. 为什么要有线程?11. 实际应用中,如何在进程与线程之间做选择?12. 什么是上下文切换?13. 什么是守护线程?14. 如何设置

2020-07-21 10:42:48 1907 5

原创 java集合(容器)Map、Collection重点难点---2020迎战java集合

目录:1. 什么是集合(容器)?2. 集合(类)的特点有哪些?3. 为什么要使用集合(类)?/集合类有哪些优势?4. 集合和数组的区别?5. java中有哪些常用的集合(容器)?6. List、Set和Map的区别?7. 集合底层数据结构是什么?8. 哪些集合类是线程安全的?9. 如何确保一个集合不能被修改?10. ArrayList和Vector的共同点和区别?11. ArrayList和LinkedList的区别是什么?12. 什么

2020-07-20 15:53:18 1228 1

原创 2020java多线程面试题(98道重点java面试题)

目录:1. 什么是并发?并发与并行有什么区别?2. 什么是并发编程?为什么不叫并行编程?3. 为什么要使用并发编程?并发编程的优点是什么?4. 并发编程的缺点?5. 并发编程三要素?6. 线程的安全性问题体现在哪几个方面?7. 如何解决线程的安全性问题?8. 什么是进程?9. 什么是线程?10. 为什么要有线程?11. 实际应用中,如何在进程与线程之间做选择?12. 什么是上下文切换?13. 什么是守护线程?14. 如何设置

2020-07-18 00:12:33 1305 7

原创 中间件小白到中白--消息中间件MQ面试题、如RabbitMQ、RocketMQ、Kafka等

目录:1. 什么是消息中间件MQ2. 为什么要使用消息中间件3. 消息队列有什么优缺点?4. 常用的消息中间件有哪些?常用中间件之间的对比?5. 常用的中间件推荐?6. 使用中间件的架构是什么样的?7. 生产者消费者模式中,客户机和服务器谁是生产者,谁是消费者?8. 中间件有哪些常见问题?如何解决这些问题?9. 什么是幂等性?10. 幂等性的实现方式有哪些?如何实现幂等性?11. 常用中间件详细介绍:12. RabbitMQ介绍1

2020-07-14 00:43:20 2868 2

原创 redis从小白到大白--2020迎战redis面试

什么是Redisredis属于NoSQL数据库,它是一个开源的使用ANSI C语言编写、遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。它通常被称为数据结构服务器,因为值(value)可以是 字符串(String), 哈希(Hash), 列表(list), 集合(sets) 和 有序集合(sorted sets)等类型。什么是可基于内存的?像mysql数据库是存放在磁盘上的,需要读取数据时去磁盘上读取,我们知道电脑有磁盘-内存-cpu..

2020-07-13 02:08:15 3301 9

原创 你的电脑是不是github访问一段时间又不能访问了?提示无法访问此网站。教你原理,这次学会就不用再百度

前几天我的github还能访问,这几天访问就出现了如下的情况:原理:修改C:\Windows\System32\drivers\etc下的hosts文件,不需要粘贴如下图太多的网址,一条就够,因为github的网址隔一段时间修改一回。- 解决方法:点击链接,查看github的IP信息:如图复制最新的IP,添加到hosts文件中:如图,注意空格如140.82.114.4 github.com下次不能访问了,修改为最新的IP就行。打开浏览器重新访问github,又可以访问了:如果还是.

2020-07-05 13:00:40 26383 16

原创 40行代码实现图片的模糊绘制---使用Turtle画笔实现图片的模糊绘制

运行环境:Python3.7,turtle库和PIL库。将参数修改成你想绘制的图片即可绘制你想要的图片。下图为正在绘制的图片:原图如下:源码如下:from turtle import *# 引入Python的内置库(画笔)turtlefrom PIL import Image# 从PIL库中引入Image方法,目的是打开并读取原图def get_color(r, g, b, alpha=256): # 获取原图片的颜色信息 rr=r/255.0 bb=b/255.

2020-07-05 11:42:39 2098 2

原创 Python爬虫模拟浏览器的headers、cookie,爬取淘宝网商品信息

一. 淘宝商品信息定向爬虫二. 爬虫基础:正则表达式三. 淘宝页面查看与分析四. 爬虫源码一. 淘宝商品信息定向爬虫注意淘宝的robots.txt不允许任何爬虫爬取,我们只在技术层面探讨这一章节的内容。二. 爬虫基础:正则表达式完整版正则表达式的详细介绍见本人的这篇博客:博客链接三. 淘宝页面查看与分析功能描述:目标:获取淘宝搜索页面的信息,提取其中的商品名称和价格理解:淘宝的搜索接口翻页的处理技术路线:requests-re淘宝商品信息起始页htt..

2020-07-04 16:58:42 4069 2

原创 计算机网络基础(五)---分层体系(结构)的优点

计算机网络分层体系(结构)的好处:(1)各层之间是独立的。基层并不需要知道它的下层是如何实现的。 而仅仅需要知道该层通过层间的接口即界面)所提供的服务。由于每层只实现种相对独立的功能,因而可将一个难以处理的复杂问题分解为若干个较容易处理的更小一些的问题。 这样,整个问题的复杂程度就下降了。(2)灵活性好。当任何一层发生变化时(例如由于技术的变化),只要层间接口关系保持不变,则在这层以上或以下各层均不受影响。此外,对某一一层提供的服务还可进行修改。当某层提供的服务不再需要时,甚至可以将这层取消..

2020-07-04 16:27:07 6214

原创 计算机网络基础(四)---计算机网络体系结构、七层协议、四层协议、五层协议

2020-07-04 16:17:38 863

原创 计算机网络基础(三)之计算机网络性能

计算机网络的性能指标:速率带宽吞吐量时延: 发送时延、传播时延、处理时延、排队时延时延带宽积往返时间RTT利用率计算机网络的非性能指标:费用质量标准化可靠性可扩展性和可升级性易于管理和维护...

2020-07-04 16:00:41 633

原创 计算机网络基础之(二)---计算机网络的类别

一. 按照网络的作用范围进行分类1 广域网WAN2 城域网MAN3 局域网LAN4 个人区域网PAN二. 按照网络的使用者进行分类1 公用网2 专用网三. 用来把用户接入到互联网的网络1 接入网AN一. 按照网络的作用范围进行分类1. 广域网WAN(1)广域网WAN (Wide Area Network)广域网的作用范围通常为几十到几千公里,因而有时也称为远程网(long haul network)。广域网是互联网的核心部分,其任..

2020-07-04 15:41:40 1542

原创 计算机网络基础之(一)---什么是计算机网络

计算机网络:计算机网络的精确定义并未统一。关于计算机网络的较好的定义是这样的:计算机网络主要是由些通用的、可编程的硬件互连而成的,而这些硬件并非专门用来实现某一特定目的(例如,传送数据或视频信号)。这些可编程的硬件能够用来传送多种不同类型的数据,并能支持广泛的和日益增长的应用。根据这个定义: (1) 计算机网络所连接的硬件,并不限于一般的计算机,而是包括了智能手机。(2)计算机网络并非专门用来传送数据,而是能够支持很多种的应用(包括今后可能出现的各种应用)。请注意,上述的“可编程的硬件..

2020-07-04 15:07:22 546

原创 大数据应用---之---互联网金融---客户风险控制

一. 前言二. 大数据在互联网金融的应用1 金融反欺诈与分析2 构建更全面的信用评价体系3 高频交易和算法交易4 产品和服务的舆情分析三. 客户风险控制1 信用评分算法2 分类模型的性能评估一. 前言互联网 金融!"是指传统金融机构与互联网企业利用互联网技术和信息通信技术实现资金融通、支付、投资和信息中介服务的新型金融业务模式。互联网金融不仅仅是互联网和金融业的简单结合,还是在实现安全、移动等网络技术的基础上,被用户熟悉接受后,自然而然..

2020-07-04 14:28:58 975 3

原创 大数据应用案例---用户画像与精准营销

一. 前言二. 用户画像概述三. 用户画像的价值四. 用户画像构建流程1 数据收集与分析2 数据建模3 构建用户画像4 数据可视化分析五. 用户标签体系1 结构化标签体系2 半结构化标签体系3 非结构化标签体系一. 用户画像与精准营销前言大数据并不是一种全新的技术,它更多的是一种借助真实数据汇聚、数据分析及其可视化、分布式计算的,利用数据分析问题的思维方式和工作方法。面对大数据这新业态,政府、企业更关心的是如何让大数据落..

2020-07-04 14:02:17 7425

原创 数据处理---之---网页排序算法

一. 网页排序算法二. 网页排序算法分类1 基于访问量的排序算法2 基于词频统计和词语位置加权的排序算法3 基于链接分析的排序算法4 基于智能化的排序算法三. TD-IDF 算法1 词频(Term Frequency, TF)2 逆文档频率(Inverse Document Frequency, IDF)四. BM25算法五. PageRank 算法一. 网页排序算法在能将“包含某关键字的网页迅速查找出来”之后,另一个问题出现..

2020-07-04 12:35:09 5945 1

原创 数据处理---之---倒排索引---讲解

一. 倒排索引二. 倒排索引原理1 词语和文档的关系2 倒排索引的数据结构3 倒排索引的建立实例4 倒排索引的更新策略一. 倒排索引倒排索引(Inverted Index) 也被称为“反向索引”或“反向文件”,是一种索引数据结构。倒排索引在“内容”(例如,单词、数字)和存放内容的“位置”(例如,数据库、文件、一组文件)之间建立映射,其目的在于快速全文检索和使用最小处理代价将新文件添加进数据库。通过倒排索引,可以快速地根据“内容”查找到包含它的文件。倒排索引是目..

2020-07-03 23:31:01 2606 1

原创 数据处理之文本分词、MMSEG分词工具、斯坦福NLTK分词工具

一. 文本分词概述二. 中文分词算法分类三. MMSEG分词工具四. 斯坦福NLTK分词工具1 CRF方法实例一. 文本分词概述文本分词是将字符串文本划分为有意义的单位的过程,如词语、句子或主题。由计算机实现的文本分词结果也应该满足人类思维阅读文本时的处理模式。在现实中,英文词组是以单词为单位,以空格为分隔,在分词上具有巨大的便利性。例如,英文句子“What will the big data bring",用中文表示则为“大数据将带来什么”。计算机可以很简单地通过空..

2020-07-03 22:36:44 1584 4

原创 数据挖掘的前提---信息抓取:通用爬虫和聚焦爬虫

一. 互联网信息抓取二. 爬虫概述三. 通用爬虫和聚焦爬虫四. Nutch搜索引擎五. 爬虫实例分析:舆情信息汇聚一. 互联网信息抓取随着网络的迅速发展,Internet (万维网)成为当今世界最大的信息载体,每天又有不可计数的新数据涌入Internet 中。如今, 人们面临的一个巨大的挑战就是如何从海量数据中提取有效信息并加以利用。“ 要处理数据,就要先得到数据”,从Internet 上将数据获取下来,是进行数据处理的第一步。互联网信息自动抓取,最常见且有效的方式是使..

2020-07-03 21:55:52 5988 2

原创 数据可视化---以小见大,数据可视化基础讲解

一. 数据可视化及基本特征二. 数据可视化可视化的目标和作用1 数据表达2 数据操作3 数据分析三. 数据可视化流程1 数据获取2 数据处理3 可视化模式4 可视化应用四. 数据可视化方法1 文本可视化2 网络可视化3 时空数据可视化4 多维数据可视化一. 数据可视化及基本特征数据可视化是数据加工和处理的基本方法之一,它通过图形图像 等技术来更为直观地表达数据,从而为发现数据的隐含规律提供技术手段..

2020-07-03 17:22:06 2197 1

原创 深度学习案例:Caffe手写体数字识别

一. Caffe简介二. 数据准备三. 模型设计四. 模型训练五. 模型测试一. Caffe简介Caffe是一个清晰、 高效的深度学习框架,Cafe 安装包中自带了MNIST (手写体数字)的例子。本节将通过利用MNIST具体实例,了解深度学习应用的整个流程。二. 数据准备首先准备批图像数据。将图像数据集分为测试集和训练集两个部分, 并生成标签文件train.txt 和val.txt。 训练集用来建立模型,测试集用来评估模型的预测能力,标签文件用来标明数据分类..

2020-07-03 16:50:10 1055

原创 深度学习开源软件功能对比

软件开发语言CUDA支持分布式循环网络卷积网络RBM / DBNsTensorFlowC++、Python√√√√√CaffeC++、Python√×√√×TorchC++、Lua第三方实现×√√√TheanoPython√×√√√MXNetC++、Python,Julia、Matlab、Go、R、Scala√√√√√CNTKC++√×√√可借助“ConvertDBN comm...

2020-07-03 15:18:25 537

原创 大白话入门深度学习---探索深度学习的发展路线:人脑神经网络-人工神经网络-深度神经网络

12:49:126.2.3人脑神经网络人的大脑中存在着无数神经元,各个神经元相互连结,构成一个较大的神经网络,用来处理人脑从外界接收的信息。但是,人类的大脑并不是从一开始就能处理一些复杂的问题的。婴儿刚出生时,大脑的神经元已产生,并且迁移到大脑相关部位去了,但是此时的神经元还只有少量的突触,连接较为简单,仅能做出基本的神经反射。出生之后,面对外界的新环境,婴儿的大脑不断接收外部信息,各种信息刺激了婴儿的脑部发育,脑内的神经元之间不断重组、连接,形成更复杂的神经网络,使个体渐渐具有其他的活动能力。大地生

2020-07-03 14:50:23 1078

原创 数据挖掘与机器学习的联系与区别、挖掘工具Mahout、Spark MLlib讲解,Mahout和MLlib支持的机器学习算法列举

一. 数据挖掘与机器学习二. 数据挖掘工具Mahout讲解三. Mahout 在各平台所支持的机器学习算法四. 数据挖掘工具MLlib讲解五. MLlib 所支持的机器学习算法一. 数据挖掘与机器学习数据挖掘是识别出海量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单来说就是从海量数据中找出有用的知识。机器学习起初的研究动机是为了让计算机系统具有人的学习能力,以便实现人工智能。机器学习利用经验来改善计算机系统自身的性能,由于“经验”在计算机系统中是以..

2020-07-03 12:16:43 2097 4

原创 抖音美女越刷越多...数据挖掘惹的“祸”,淘宝精确营销与数据挖掘

一. 数据挖掘综合案例:淘宝网精确营销、抖音视频精准推荐二. 为什么要进行数据挖掘三. 实际案例分析方法与过程1 客户忠诚度分析2 客户群细分一. 数据挖掘综合案例:淘宝网精确营销、抖音视频精准推荐在淘宝上买东西,刚开始没什么感觉,买的越多越停不下来,“剁手”极其“残忍”。但这不是你的锅,淘宝的推荐算法抓紧你的心啊!同样,抖音一看上就停不下来,美女越刷越多有木有?支撑这些的就是数据挖掘。数据挖掘在各领域的应用非常广泛,只要该产业拥有具备分析价值与需求的数据..

2020-07-02 23:13:12 1290 1

原创 数据挖掘--“聚类”详解、K-means、K-平均值算法、K均值算法

一. 什么是聚类二. 聚类步骤三. 聚类算法有哪些1 层次聚类算法2 划分聚类算法3 基于密度的聚类算法4 基于网格的聚类算法5 基于模型的聚类算法一. 什么是聚类?物以类聚,人以群分,聚类分析是一种重要的多变量统计方法。 聚类分析最早起源于分类学,最初,人们依靠经验将一类 事件的集合分为若干子集。随着科技的发展,人们将数学工具引入分类学,聚类算法便被细化归入数值分类学领域。后来,信息技术快速发展,新数据的出现呈井喷趋势,其结构的复杂性和内容的多..

2020-07-02 18:26:16 3016

原创 数据挖掘--“分类”详解、K最近邻、决策树、贝叶斯分类、支持向量机--算法讲解

一. 什么是分类二. 分类步骤三. 分类算法有哪些1 K最近邻算法2 决策树3 贝叶斯分类器4 支持向量机二.设计思路和设计构图一. 什么是分类?分类技术或分类法(Classification) 是一种根据输入样本集建立类别模型,并按照类别模型对未知样本类标号进行标记的方法。在这种分类知识发现中,输入样本个体或对象的类标志是已知的,其任务在于从样本数据的属性中发现个体或对象的一般规则,从而根据该规则对未知样本数据对象进行标记。分类是一种 重要的数据分析..

2020-07-02 11:30:30 2580 1

原创 数据挖掘常用算法有哪些?分类、聚类、预测、关联规则

数据挖掘常用算法1 分类在数据挖掘的发展过程中,由于数据挖掘不断地将诸多学科领域知识与技术融入当中,因此,目前数据挖掘方法与算法已呈现出极为丰富的多种形式。从使用的广义角度上看,数据挖掘常用分析方法主要有分类、聚类、估值、预测、关联规则、可视化等。从数据挖掘算法所依托的数理基础角度归类,目前数据挖掘算法主要分为三大类:机器学习方法、统计方法与神经网络方法。机器学习方法分为决策树、基于范例学习、规则归纳与遗传算法等:统计方法细分为回归分析、时间序列分析、关联分析、聚类分析、模糊集、粗糙集、探索..

2020-07-01 23:21:04 18446

原创 2020年了,还不懂数据挖掘?数据挖掘工具有哪些?

一. 数据挖掘定义二. 数据挖掘特征三. 数据挖掘工具1 Weka2 SPSS3 Clementine4 RapidMiner5 其他数据挖掘软件一. 数据挖掘定义数据挖掘:严格的科学定义上,数据挖掘是从大量的、有噪声的、不完全的、模糊和随机的数据中,提取出隐含在其中的、人们事先不知道的、具有潜在利用价值的信息和知识的过程。从技术角度分析,数据挖掘就是利用一系列的相关算法和技术,从大数据中提取出行业或公司所需要的、有实际应用价值的知识的过程。这些..

2020-07-01 23:07:45 3479

原创 什么是ETL、Kettle,Kettle数据迁移、常用ETL工具

ETL:ETL是用来描述将数据从源端经过提取、转换、装入到目的端的过程。ETL是构建数据仓库的重要一环,它包含了三个方面,首先是“抽取”,将数据从各种原始的业务系统中读取出来,这是所有工作的前提。其次是“转换”,按照预先设计好的规则将抽取的数据进行转换,使本来异构的数据格式能统一起来。最后是“装载”,将转换完的数据按计划增量或全部导入到数据仓库中。常用ETL工具:ETL工具的典型代表有Informatica PowerCenter、IBM Datastage、Oracle Warehouse Buil.

2020-07-01 16:33:29 1025

原创 c#实现类似Sublime Text文本编辑器、电脑屏幕画板

一.前言需要源码请留言,环境配置请留言,项目运行时报错请留言结课设计,使用vs2017开发winForm窗体应用程序,包括简单的sublime text文本编辑器、屏幕画板程序。一. 前言二. 简单的文本编辑器三. 屏幕画板二.简单的文本编辑器主界面:文件另存:菜单栏:编辑菜单栏:格式菜单栏:夜间模式:一. 回到目录三.屏幕画板屏幕画板主界面功能显示:一. 回到目录...

2020-07-01 13:31:01 748 1

原创 还在夜店喊..857..857?快来学习Python+OpenCV实现857车牌识别、实时车牌识别(结课设计)

一.前言结课设计…顺利过。项目主要是利用OpenCV的SVM支持向量机,来进行车牌字符的训练,并进行字符的分割、字符识别等。使用Python内置模块Tkinter来实现系统的图形界面。将识别到的车牌与数据库中的黑名单车牌比对,实现正常车牌的快速放行以及黑名单车牌的及时报警。图形界面预览:车牌识别的方法有很多种,如支持向量机、机器学习Tensorflow等。其原理类似,都是对训练集进行训练,使用测试集进行测试从而实现车牌识别功能。一. 前言二. 设计思路和设计构图1

2020-07-01 11:45:35 5527 72

计算机图形学完整课件

计算机图形学完整课件-

2020-07-05

大数据可视化--联通用户活动规律可视化样本数据csv文件

【知识准备】 探索性数据分析的基本原理和方法;Python语言及相关包的运用;Pandas;Numpy;Matplotlib;Seaborn;Scikit-Leart。 【实训要求】 1、观察样本数据的结构和数据特征; 2、读取样本数据,观察样本数据结构和头尾各10行数据; 3、对样本数据进行分析,找出业务数据中的分布规律; 4、用可视化方法对分析结果进行展示。 5、观察并找出每个特征的样本数据的缺失值和异常值等并提出解决办法; 6、对样本数据进行预处理; 7、采集样本数据存入HBase数据库(选)。 【实训内容】 任务2-1 1、数据源:“sodadata”文件夹下“联通数据_Sample”。 2、项目数据集: 表一结果_Sample_1000条.csv 表二结果_Sample_1000条.csv 3、针对表一样本数据: (1)分析并展示不同时间段采样的基站服务区内移动用户的活跃度分布; (2)分析并展示服务区内移动用户工作时间和休息时间的活跃度分布,筛选出当地居民和外来移动用户; (3)分析用户活动规律,根据其通信特点进行分类。(选做) 4、针对表二样本数据: (1)分析并展示样本数据中年龄、性别、终端品牌等各类数据的分布规律; (2)分析缺失和异常数据,提出处理预处理方案; (3)筛选高价值重点用户(提示:从业务量或消费等方面思考); (4)如果表一和表二从相同的服务区采集,请思考并提出你的进一步分析方案和商业营销方案。(选做) 5、用Jupyter Notebook根据实训要求编写程序和文档,最终结果打印输出为PDF文档;

2020-07-05

思科双核心双路由双出口三层结构园区网拓扑图

本项目是思科双核心双路由双出口三层结构园区网拓扑图

2020-07-05

思科配置双核心双路由双出口园区网详细命令

本文是思科模拟器上配置双核心双路由双出口园区网详细命令

2020-07-05

c#实现的五子棋小游戏

c#实现的五子棋小游戏,实现了client端与server端的连接,在一台电脑上完成五子棋游戏的使用。

2020-07-03

c#开发坦克大战小游戏

c#开发坦克大战小游戏,使用winform窗口,使用vs2017即可运行

2020-07-03

html资料基础讲义

课程包括:1Internet基础知识、2html语言基础、3Dreamweaver、4.VBScript脚本语言、6网站建设流程、7html示范教学、网页制作之JavaScript

2020-07-02

Python基础知识讲义

资源内容是Python的基础知识点讲义,包括Python的类机制、内存机制、继承多态等。实现了名片管理系统在第六章。

2020-07-02

车牌识别SVM,已经训练好的样本集,直接可用于车牌识别

车牌识别SVM,已经训练好的样本集,直接可用于车牌识别。包括两个文件,svm.dat和svmchinese.dat,其中前一个文件用于识别字母和数字;后一个文件用于识别汉字。

2020-07-02

车牌字符(省份简称、数字、字母)训练样本集

资源内容包括车牌省份的简称、数字、字母的训练样本集合,如京、津、冀、晋、陕、甘、宁、沪。字母如A、B、T、M等。

2020-07-02

Flume+Kafka+Storm+Hbase实现日志抓取和实施网站流量统计

搭建Hadoop集群,并使用flume+kafka+storm+hbase实现日志抓取分析,使用一个主节点master、两个slave节点

2020-07-02

C#开发类sublime text文本编辑器

设计一个多文档界面的Windows应用程序,能够实现对文档的简单处理,包括:打开、关闭、保存文件,复制、剪切、粘贴、撤销等文本处理功能,同时能实现打印。

2020-07-01

带图形界面、车牌识别源码python+opencv

结课设计…顺利过。项目主要是利用OpenCV的SVM支持向量机,来进行车牌字符的训练,并进行字符的分割、字符识别等。使用Python内置模块Tkinter来实现系统的图形界面。将识别到的车牌与数据库中的黑名单车牌比对,实现正常车牌的快速放行以及黑名单车牌的及时报警。

2020-07-01

思科三层交换机实现vlan间路由拓扑图

思科三层交换机实现vlan间路由拓扑图。使用Cisco Packet Tracer模拟器实现Cisco三层交换机实现Vlan间路由的配置脚本,内含每一步的详细操作及注释说明,包括配置接入层交换机、配置核心交换机、配置firewall路由器、配置ISP互联网路由器、配置分公司路由器、配置Wlan无线接入、配置PPPoe、配置voip

2020-07-01

三层交换实现vlan间路由配置脚本

使用Cisco Packet Tracer模拟器实现Cisco三层交换机实现Vlan间路由的配置脚本,内含每一步的详细操作及注释说明,包括配置接入层交换机、配置核心交换机、配置firewall路由器、配置ISP互联网路由器、配置分公司路由器、配置Wlan无线接入、配置PPPoe、配置voip

2020-07-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除