自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (2)
  • 收藏
  • 关注

原创 python爬取猫眼电影信息

爬取TOP100所有电影的信息,(电影名, 主演, 上映时间)爬取该电影的宣传封面的图片, 保存到本地/mnt/img/目录中;将获取的信息, 保存到mysql数据库中(电影名, 主演, 上映时间, 封面图片的本地路径)import re#<p class="releasetime">上映时间:1998-04-03</p&amp

2018-06-26 14:48:53 777

原创 web淘宝网页设计

<style> #line_01{ width:100%; height: 86px; } #line_01_a{ width: 460px; float: left; text-align: right; ...

2018-06-25 19:53:11 9000 6

原创 python——socket编程

客户端/服务器架构 服务器就是一系列的硬件或软件,为一个或多个客户端提供所需的服务,它存在的唯一目的就是等待客户端的请求,并响应它们,然后等待更多的请求。 客户端/服务器网络编程 在服务器响应客户端请求之前,必须进行一些初步的设置流程来为之后的工作做准备。首先会创建一个通信端点,它能够使服务器监听请求。可以把服务器当作公司的前台,或者应答公司主线呼叫的总计接线员。一旦电话号码和设备安装成功且...

2018-06-21 14:47:21 1943

原创 python分布式进程管理

对分布式进程管理的理解 把多进程分布到多台机器上,一个服务进程可以作为调度者,依靠网络通信将任务将分配到多个进程中,如果有一个通过Queue通信的多进程程序,将发送任务的进程和处理任务的进程分布到两台不同的主机上,原有的queue可以继续使用,单是通过managers模块将Queue通过网络暴露出去,就可以让其他机器的进程访问Queue了。 服务进程:负责启动Queue,把Queue注册到网络...

2018-06-20 23:18:11 692

原创 python正则表达式

正则表达式为高级的文本模式匹配、抽取、与/或文本形式的搜索和替换功能提供了基础。正则表达式描述了模式的重复或者表述多个字符. 特殊符号和字符 表示法 描述 ^ 匹配字符串开头,在多行模式匹配每一行的开头,如果放在【】里面,则表示反取 $ 字符串结束位置与匹配规则符合旧匹配,否则不匹配 * 允许前一个字符重复0或多次 ? 允许前一个...

2018-06-20 17:32:14 187

原创 python协程

对协程的理解协程可以认为是比线程更小的执行单元,自带CPU上下文,这样只要在合适的机会下,可以把一个协程切换到另一个协程,只要这个协程中保存或恢复CPU上下文那么程序还是可以运行的。可以说协程是一种用户态的轻量化线程。协程VS线程协程拥有自己的寄存器上下文和栈,协程调度切换时将寄存器和栈保存到其他地方,在切换回来时恢复先前的寄存器上下文和栈。因此,协程能保留上一次调用时的状态,也就是进...

2018-06-19 19:50:47 166

原创 python 多进程

进程进程是一个执行中的程序,每个进程拥有自己的地址空间、内存、数据栈以及其他用于跟踪执行的辅助数据,所以采用进程间通信的方式共享信息,操作系统管理其上所有进程的执行,并为这些进程合理的分配时间。创建子进程进程之间的父子是相对的import timeimport os# os.getpid()获取当前进程的PID号;print("主进程%s正在启动....." %...

2018-06-13 21:24:24 182

原创 python多线程编程

进程进程是一个执行中的程序,每个进程拥有自己的地址空间、内存、数据栈以及其他用于跟踪执行的辅助数据,所以采用进程间通信的方式共享信息,操作系统管理其上所有进程的执行,并为这些进程合理的分配时间。线程线程与进程类似,不过他们是在同一进程中执行的,并共享相同的上下文。线程包括开始、执行、结束。它有一个指针,用于记录当前运行的上下文。当其他线程运行时,它可以被抢占(中断)或临时挂起,这种方法...

2018-06-13 20:52:42 217 1

原创 Linux磁盘与文件管理系统

硬盘的组成与分区组成圆形的盘片(主要记录路数据的部分);机械手臂与机械手臂上的磁头(读写圆盘上的数据);主车由马达,可以转动圆盘让机械手臂的磁头在盘片上读写数据;扇区为最小的贮存单位,每个扇区为512bytes;将扇区组成一个圆就是一个柱面,柱面是分区的最小单位;第一个扇区最重要,里面有硬盘的主引导程序(MasterbootrecordMBR),以及分区表(partitio...

2018-06-12 08:34:06 227

原创 python发送邮件

邮件发送1.用163和qq邮箱来实现 登陆163邮箱网页版,在设置里开启POP3/SMTP/IMAP服务,用手机短信认证设置授权码 2.python实现 将设置信息放在配置文件 mailConf.pysmtpServer='smtp.163.com' #使用的服务器sender='[email protected]' #发送端的邮箱地址passwd='we***2...

2018-06-11 23:52:47 1572

原创 对Excel表格的操作

基本操作excel文件 example.xlsx 导入模块import openpyxl1.读取excel文档wb = openpyxl.load_workbook('excelDemo/example.xlsx')2.在工作薄中获取工作表 返回一个列表,储存excel表中所有的sheet工作表;print(wb.sheetnames)获取当前的活动表,返...

2018-06-04 17:31:50 408

基于Hadoop的决策树识别银行贷款风险.rar

在Hadoop大数据平台的基础上构建了一个基于MapReduce框架并行化的C4.5决策树算法,并采用此算法设计了一套银行贷款的风险预测系统。算法结合MapReduce框架、HDFS 文件存储系统,使用Java语言编写,根据贷款人的各个特征属性信息增益率来选择决策点。其中包含对连续值属性、离散值属性的处理,采用后剪枝悲观剪枝的方法对决策树进行剪枝,以避免决策树出现过拟合的特征。系统包含数据导入、数据分析、结果展示等模块,操作简单、快捷,能准确预测贷款人的信誉情况,平均准确率达到65%~80%,而且与传统的决策树模型相比在性能方面有更好的提升。

2020-12-16

Java实现基于C4.5算法的决策树,实现银行贷款风险预测

使用Java实现基于C4.5算法的决策树,实现银行贷款风险预测,包括对离散属性和连续属性的处理。适用于离散属性、连续属性共存的数据。

2020-02-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除