自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

原创 python进行多模态情感分析的数据预处理

当涉及到多模态情感分析时,我们需要处理多种类型的数据,例如文本、图像和音频。在进行数据预处理之前,我们需要将不同类型的数据转换为统一的格式,并对其进行一些常见的数据处理操作。在本篇博客中,我们将使用Python来进行常见的多模态情感分析数据预处理。

2023-07-12 23:40:38 774 1

原创 Python进行常见数据预处理总结

数据预处理是数据分析和机器学习中非常重要的一步,它可以帮助我们清洗和转换原始数据,以便更好地进行分析和建模。Python提供了许多强大的库和工具,使得数据预处理变得更加简单和高效。本文将介绍一些常见的数据预处理技术,并提供相应的Python代码示例。

2023-07-12 23:36:45 1030 1

原创 基于Django框架+Mysql数据库实现的电影推荐系统

看电影作为娱乐生活中重要的组成部分,在疫情的冲击下,人们逐渐从线下观影转为线上观影,线上观影的市场规模正在飞速发展,用户在享受观影的同时,会迷失在海量的片源中。本项目旨在根据用户的喜好,给用户推荐相关的电影,让用户在有限的休息时间中,享受到最大的快乐

2023-01-11 22:02:49 2476 8

原创 基于机器学习的台风灾害评估分析

世界气象组织定义:中心持续风速在12级至13级(即每秒32.7米至41.4米)的热带气旋为台风或飓风。台风作为自然灾害之一,形成于热带或副热带26℃以上广阔海面上的热带气旋,其巨大的破坏力主要由强风、暴雨和风暴潮三个因素造成,具有突发性强,破坏力大等特点。我国沿海城市在夏季经常会受到台风造成的经济影响、社会影响,对此我以机器学习相关算法拟定一个台风灾害评估分析的流程系统,为灾害有关管理部分提供智能决策支持。

2022-04-24 22:31:08 2096

原创 基于HTML+css+js设计简易的汽车用户注册界面

应用背景为假设以福建省某汽车4s店用户的注册管理来实现,设置用户名、密码、二次确认密码、邮箱、真实姓名、所属区市、汽车类型这几个注册信息,在注册新用户的过程中,每个注册信息都借助JavaScript与正则表达式的相关知识进行信息合理性检查,而背景则是同时连接本地图片进行设置,至于注册框的颜色设置以及布局效果则是根据css与div的相关知识内容进行实现,详细内容介绍代码中均有注释。

2022-03-26 18:29:59 1206

原创 灰色预测模型实现python

灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。其用等时距观测到的反映预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。

2022-02-25 16:51:20 2380 1

原创 SnowNLP实现情感分析(今日头条用户评论为数据源)

SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode

2022-02-21 23:10:15 7647 2

原创 python实现获取搜索引擎式的城市天气预报及历史天气

根据操作者在键盘上所输入的城市及具体时间,自动爬取其相关的天气信息

2022-02-20 11:38:07 826

原创 利用Scrapy框架进行信息爬取并以mysql进行存储

以爬取当当网的相关数据对scrapy框架进行实现测试

2022-02-20 04:45:00 678

原创 基于Xpath与beautiful soup4 库爬取网络信息

通过网络爬虫技术对目标网址进行信息精准获取是当今大数据行业不可缺少的技能之一,本次内容我将介绍基础的爬虫知识及相关内容并以实例进行演示

2022-02-19 21:58:03 820

原创 Hbase部署(单机模式)安装详细流程

Hbase的名字的来源是Hadoop database,即hadoop数据库,Hbase是大数据行业十分常见的工具之一,但是一开始的安装就让许多人望而却步,接下来我将手把手教大家安装hbase

2022-02-19 21:07:10 5807

原创 python实现文本数据预处理(去停用词、分词、分句等)

如今的大数据时代,互联网信息的实时交流导致产生了许多各种各样的信息,例如我们如果最常见到的信息之一----------评论,通过相关的预处理提取出我们想要的关键信息

2022-02-18 21:38:37 5212

原创 基于Hadoop与Spring+ssm框架相关知识开发的浏览统计网站

本项目的主要流程为:首先通过提供的ip日志数据,进行数据预处理,并将处理后的数据上传到分布式文件管理系统(HDFS)上,再导入到Hive数据库中,然后使用Navicat工具连接Mysql数据库,并使用Sqoop将数据导出,然后搭建SSM+Spring框架,自定义传导至前端的web接口,使用Tomcat、HTML语言、SQL语言等相关知识进行操作,最后实现数据的最终可视化界面

2022-02-16 22:15:05 1477 1

原创 基于Scala设计简易的会员卡管理系统

Scala是一门多范式的编程语言,一种类似Java的编程语言,设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性,以Scala语言来设计一个简易的系统来进一步巩固和学习其特性。

2022-02-16 21:31:37 937

原创 Mongodb分片集群的部署及操作

在Linux上进行mongodb分片集群的部署并进行一些常规性测试操作

2022-02-16 21:09:49 2836

原创 基于java设计一个可视化中智数计算器

在我们日常处理问题时,大部分情况下很难找到能完全符合我们问题需求的计算方式,所以需要我们根据实际需求创作针对性计算方式,接下来我将以中智数计算器为例进行我的经验分享

2022-02-16 15:26:49 1014 1

原创 基于java实现的字体颜色切换器

基于java实现的字体颜色切换器

2022-02-16 15:15:01 869

原创 基于python语言设计的词云定制器

基于纯python语言实现的一个词云定制器项目,通过自己喜爱的logo及小说进行词云图的定制

2022-02-15 23:52:13 622

原创 基于python的Topsis(优劣解距离)算法的实现(附代码及举例说明)

TOPSIS 法是一种用于组内综合评价十分常见的算法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距。例如当我们在面对离散性、随机性较高的原始数据时,为了通过对这些数据进行分析从而得到最优解,不妨可以试试这种算法。下面我将以2021数学建模比赛中c题数据及问题为例进行演示说明。

2022-02-15 23:18:05 3578

python实现拉依达准则处理异常数据

首先本项目的数据来源于参加的数学建模比赛官方C题提供的相关数据,由于在进行建模和数据分析时,发现预处理的数据存在随机异常性、离散性等不利于模型分析的性质,所以使用了拉依达准则对数据进行处理,而python的对于大多数编程基础较弱但又想通过编程实现某种算法的同学十分地友好,所以我将使用python进行拉依达准则的实现,话不多说,上代码!

2022-02-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除