自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Python极客之家

利用python完成小项目,涵盖网络爬虫、数据分析、数据可视化、机器学习、数据挖掘和自然语言处理等领域,帮助初学者快速掌握python。

  • 博客(48)
  • 资源 (136)
  • 收藏
  • 关注

原创 Python 毕设精品实战案例——快速索引目录Part2

Python 毕设精品实战案例,涵盖网络爬虫、数据分析、数据可视化、机器学习、数据挖掘和自然语言处理等领域,帮助初学者快速掌握python。

2022-08-13 23:25:45 11544 2

原创 Python 毕设精品实战案例——快速索引目录

Python 毕设精品实战案例,涵盖网络爬虫、数据分析、数据可视化、机器学习、数据挖掘和自然语言处理等领域,帮助初学者快速掌握python。

2022-05-08 12:14:11 3910 6

原创 基于Python的书籍数据采集与可视化分析系统

通过本系统,用户可以方便地查询和筛选图书数据,观察图书的分类分布、评分分布、热门图书、评论数量等指标,同时还可以对数据进行深入的分析和挖掘,了解读者的阅读喜好、市场趋势和预测未来的发展。本系统的设计和实现旨在为用户提供更加全面、准确、便捷的数据可视化分析服务,帮助用户更好地把握市场动态和趋势,提高决策的准确性和效率。

2023-11-09 22:50:31 598

原创 基于 Python 的课程助教智能聊天机器人

本项目通过利用网络爬虫爬虫,自然语言处理等相关技术,为改善网络搜索信息分布范围广,水平参差不齐的问题,设计了一款面向操作系统课程的聊天机器人。能够使用户更方便的获取信息,用户只需要输入自然语言问题,从互联网采集相关课程资料,经过信息抽取整合后,交互问答的形式返回给用户正确的答案。

2023-11-09 21:33:22 413

原创 基于机器学习的 ICU 脑血管疾病死亡风险智能预测系统

本系统通过构建决策树机器学习算法,可根据ICU中脑血管疾病患者的实时17项生理参数的输入来实时预测患者的死亡风险,预测结果为0代表无风险,结果为1代表有风险。利用Pandas、Numpy、Matplotlib 和 Seaborn 等工具包对脑血管数据进行多维度的可视化分析。最后,利用 Flask + Bootstrap + Echarts 框架搭建 Web 系统,通过上传最新 ICU脑血管监测数据,实时预测患者的死亡风险。

2023-11-08 23:07:39 1245 3

原创 基于自然语言处理的结构化数据库问答机器人系统

本项目通过网络爬虫采集否地区的二手房房源数据,经过数据清洗后存储到关系型数据库中,利用自然语言处理(NLP)技术,以自然对话形式,将用户查询转换为标准的 SQL 语句,并进行执行,查询关系数据库获得结果,通过对结果进行格式化处理,以文本形式返回给用户。

2023-11-08 21:26:36 960

原创 基于大数据的NBA球员数据分析及预测系统

本项目利用网络爬虫抓取 NBA 球员的所有赛季的数据,包括三分、篮板等各项参数,对每位球员的精细分析和数据可视化,不仅能帮助球队科学高效地分析球员优劣,为球队排兵布阵提供依据,还能让伟大的运动传奇更具商业价值。...

2022-07-13 23:22:07 6677 4

原创 基于数据挖掘的智能停车场运营数据分析系统

随着大数据分析技术的发展,智慧城市、智慧停车的领域正在发展,智慧停车场可以采集、记录以及存储停车场的运营数据,停车数量与时间的关系可显示停车场的运行状态。本项目基于停车场的运营数据,利用python 实现对智能停车场运行数据的可视化统计分析,对停车时间、停车高峰期时间占比、停车星期比 、每日接待车辆统计、车辆归属地等多个维度进行可视化分析,利用flask构建web后台rest接口服务,echarts实现前端可视化。......

2022-07-10 16:49:04 3863 3

原创 基于大数据的校园一卡通数据分析与可视化平台

本项目基于国内某高校校园一卡通系统一个月的运行数据,使用数据分析和建模的方法,挖掘数据中所蕴含的信息,对学生在校园内的消费行为、生活习惯和消费金额等方面进行规律分析,同时对学校不同食堂、商铺等销售数据、人流量等维度进行统计分析,并构建 web 交互平台,通过视觉感知,更清晰直观、方便快速地抓住数据的信息,辅助管理者做出高效的决策。...

2022-07-09 21:40:40 5062 1

原创 基于数据挖掘的疾病数据可视化分析与预测系统

本项目利用数据挖掘分析某医院近几年的就诊数据,分析疾病病人年龄的平均数、众数,已婚/未婚占比,不同地区患病人数,不同职业患病人数,治愈疾病花费的钱的平均数等,根据分析得到的数据对当前疾病进行分类等功能。...

2022-07-06 23:21:45 3647 5

原创 基于大数据的农产品价格信息监测分析系统

本项目利用网络爬虫技术从某蔬菜网采集所有农产品的价格数据,包括北京、上海、安徽、湖北等全国所有省和直辖市的农产品价格数据,解析后存储到数据库中。 建立农产品价格数据仓库,以web交互形式对外提供检索服务,并利用 echarts 实现农产品的可视化分析。...

2022-07-05 23:30:11 4791 21

原创 基于大数据的动漫影视数据采集与可视化分析系统

本动漫分析系统的网站搭建拟采用B/S (Browser/Server)平台技术,使用HTML等实现网页展示,将数据格式化,并存储到json文件中,利用flask搭建后台系统,前端采用 bootstrap 和Echarts实现动漫数据的可视化展示和交互,并从多种因素分析影响动漫的评分情况。...

2022-07-05 22:25:03 3695 3

原创 基于排序变换混沌置乱算法的图像加密系统

本项目利用基于排序变换的混沌置乱算法实现了一个图像加密与解密系统,设计了一个混沌图像置乱算法,新算法不经过量化,而是直接通过混沌序列的排序变换来得到图像置换的地址码,有效地避免了量化必须已知混沌轨道分布密度函数的要求,同时也降低了算法的时间复杂度。系统可方便图片在公开信息通道进行加密传播。本文利用 html + css + JavaScript 构建了页面友好的图像加密系统(静态页面),加密方式包括:方块混淆、行像素混淆、像素混淆、行模式和行+列模式等五种模式。...

2022-07-04 22:30:38 4363 3

原创 基于大数据的智慧旅游数据分析系统

本项目利用网络爬虫技术从某旅游网站爬取各城市的景点旅游数据,根据旅游网的数据综合分析每个城市的热度、热门小吃和景点周边住宿, 可以很方便的通过浏览器端找到自己所需要的信息,获取到当前的热门目的地,根据各城市景点的数据,周围小吃,住宿等信息,制定出适合自己的最佳旅游方案。......

2022-07-02 20:33:27 5376 4

原创 基于数据挖掘的Nginx日志可视化分析系统

本项目利用 python 解析 Nginx 的日志信息,包括错误日志和正常日志,解析出访问的 ip、访问方式、访问时间、访问路径、浏览器信息等信息,并从多维度可视化分析。包括:访问的PV/UV时序分析、访问的操作系统分析、访问方法分析 访问协议分析、访问状态码分析、异常访问分析、错误/攻击日志等多维度的分析。...

2022-07-02 17:53:37 1812 4

原创 基于大数据的高校贴吧舆情数据分析系统

本项目利用网络爬虫从某高校贴吧抓取某几个大学学生发帖的数据,包括发帖内容、发帖时间、用户名等信息,对数据完成清洗并结构化存储到数据库中,利用 flask 搭建后台系统,对外提供标准化的 restful api 接口,前端利用 bootstrap + html + css + JavaScript + echarts 实现对数据的可视化分析。系统可实现对高校舆情的监视,查看学生发帖的时间分布情况,近期关注的热点词等功能。...

2022-07-02 16:17:29 3958 2

原创 基于大数据技术的健身用户消费分析系统

本课题尝试以健身用户消费分析为切入点,来探讨健身用户消费行为对人们的健康生活方式有何种影响,利用 pandas + numpy 对健身数据进行统计分析,包括消费月度总趋势分析、用户个体行为分析、复购率与回购率分析、用户行为中层分析,并利用 flask 搭建后台,构建标准 restful 接口,前端利用 bootstrap + echarts + jquery 调用后台接口。...

2022-07-01 23:34:01 1070

原创 基于大数据的高校英语现状分析

全球化时代,英语的重要性日益凸显。现如今我国高校英语教育还存在教学形式单一、没有创新、传统模式已经不适合当今社会发展等弊端,需要制订出符合国情的教学规划,采取相对应的策略,增进教育理念,培养高素质人才。本项目利用 pandas + Matplotlib + seaborn + sklearn 等工具包对某高校各大学院学生历年的四六级数据进行多维度的统计分析,展现高校英语的现状,为英语教学改革提供精细化的分析。......

2022-06-30 22:57:40 672

原创 基于大数据的高校生源可视化分析系统

随着高校新生的增加,学生的数据也越来也多,怎么使用 好这些数据,对数据进行分析和挖掘成为了研究的热点,本次课题就是通过获取某学校的学生相关信息,利用 pandas + Matplotlib + seaborn 等工具包以可视化的方式从不同层面进行数据的分析。......

2022-06-30 21:53:58 1792

原创 基于 Python 的高考志愿高校及专业分析系统

本项目利用网络爬虫技术从某高考网抓取各大高校的历年高空录取分数线,并进行数据清洗存储到文件系统中,对外提供高校信息查询服务和依据高空分数筛选可能录取的高校等信息,方便考生选择合适的学校进行填报。 以高校搜索,查看该高校不同专业历年的录取分数线,以专业搜索,可查看不同高校该专业的录取分数线情况,以分数搜索,可查看可录取的高校和专业。......

2022-06-30 20:40:13 3047 3

原创 基于python的民宿旅馆消费数据分析系统

随着我国旅游业的不断发展,名宿作为一种新型而具有特色的接待形式,通过温馨而亲民的方式为游客提供了更加具有地方特色的旅游体验。本项目利用网络爬虫技术从去哪儿网采集名宿酒店数据,并进行数据清洗和格式化,利用 flask 搭建后台,前端利用 echarts 等实现对名宿酒店的各类属性分布进行可视化分析。...

2022-06-29 22:34:04 3341 2

原创 基于python的城市旅游数据采集分析系统

本项目利用网络爬虫技术从某旅游网站爬取各城市的景点旅游数据,根据旅游网的数据综合分析每个城市的热度、热门小吃和景点周边住宿, 可以很方便的通过浏览器端找到自己所需要的信息,获取到当前的热门目的地,根据各城市景点的数据,周围小吃,住宿等信息,制定出适合自己的最佳旅游方案。...

2022-06-28 23:47:48 4907 6

原创 基于KMeans聚类算法的网络流量分类预测

网络流量分类或网络流量异常检测,采用基于聚类的机器学习算法,实现异常检测与分类,即划分为正常流量和异常流量。 本项目利用 pandas + Matplotlib + seaborn + sklearn 对网络流量数据进行统计分析,并构建聚类算法实现对流量的分类建模。......

2022-06-28 22:46:28 3301 2

原创 基于外卖平台POI的城市餐饮业空间热点分析系统

本项目利用网络爬虫技术从某外卖平台APP采集餐饮商铺数据,系统采用 flask 搭建 web 后台,利用 pandas 等工具包实现对数据整体质量分析、评分和价格等维度分析等进行统计分析,并利用 bootstrap + echarts 进行前端渲染可视化。同时对分析出的商铺平均得分和平均价格等信息,通过百度地图API实现热力图的可视化展示。......

2022-06-27 00:53:22 963

原创 基于Apriori算法的奖学金获得者特点研究

高等院校在每年评选奖学金工作中积累大量的数据,本课题将数据挖掘技术中的关联规则挖掘算法Apriori应用于学校学生综合测评中,通过对这些数据分析,找到学生综合测评成绩与学生成绩,学习习惯、方法、生活习惯、兴趣爱好、家庭情况,性别,父母职业,父母教育背景,父母职业,学生在校获奖情况等相关,为学生评优工作,专业教学、课程开设等提供参考依据。...

2022-06-26 23:09:04 344

原创 基于python个人睡眠质量分析设计与实现

本项目利用 pandas + Matplotlib + seaborn + sklearn 等工具包,对睡眠数据进行探索式可视化分析,并构建 KNN、LR、决策树、随机森林等算法实现对睡眠质量的预测建模。

2022-06-25 21:42:25 2728 3

原创 基于python的汽车信息爬取与可视化分析系统

本项目利用网络爬虫技术从某汽车门户网站采集汽车数据,并利用 Flask + Echarts 前后端框架, 实现对汽车数据的可视化分析,包括不同品牌汽车的评分、车型级别、车身结构、发动机、变速箱和指导价等维度进行可视化统计分析。......

2022-06-25 11:38:11 6015 2

原创 基于大数据的城市租房信息可视化分析系统

本项目利用 python 网络爬虫抓取某租房网站的租房信息,完成数据清洗和结构化,存储到数据库中,搭建web系统对租房的面积、朝向、有无地铁、公共交通工具等价格影响因素进行统计分析并可视化展示。......

2022-06-25 10:04:24 5002 5

原创 基于大数据分析的葡萄酒品质鉴别系统设计与实现

本项目针对葡萄牙北部“Vinho Verde”葡萄酒的数据集,利用pandas、Matplotlib、seaborn 等数据科学工具包对数据集进行可视化探索式分析,并构建递归决策树和随机森林算法,实现对葡萄酒质量的预测,尝试通过大数据分析方式分析影响葡萄酒品质理化因素。......

2022-06-24 22:27:27 2999

原创 基于Python热点新闻关键词数据分析系统

本项目利用网络爬虫技术从某新闻网站爬取最新的新闻数据,并进行版块分类,对某篇版块下的所有新闻进行中文分词,保留表征能力强名词和动词作为关键词,并进行关键词词频统计,同时对新闻进行词云统计和词群分析。对不同版块的新闻热度进行统计分析。利用 flask 搭建后台,构建标准的 restful 接口,前端利用 bootstrap + echarts + jquery 调用后台接口,并进行前端的渲染可视化。.........

2022-06-23 23:37:48 4120 6

原创 基于聚类算法与随机森林算法的手机终端换机推荐

本项目对原有的推荐模型进行优化,基于品牌的性能,价格及用户使用信息,对用户实行换机预测并推荐倾向的终端应用。通过模型对用户换机时机进行预测,并推荐终端模型,换机预测模型运用随机森林算法对数据进行预测,终端偏好推荐模型通过聚类算法,对用户群体进行分类,最终对模型进行输出,总结偏好分析和聚类结果,构造终端选择升级对照库和热机库,对推荐目标机型进行排序获得结果。......

2022-06-19 00:17:36 998

原创 基于 CFSFDP 聚类算法的电信客户价值分析

本项目通过对客户价值的详细分析,并利用 CFSFDP 聚类算法,对客户进行类型的划分,可以获知客户价值的大小,客户价值的类型,从而得到客户的分类。从客户需求出发,了解客户需要什么,他们有怎么样的特征,电信运营商为客户设置不同的优惠套餐,以争取更多的用户:推出不同的优惠套餐,降低客户流失率、提高收入、增加 ARPU 值(average revenue per user 每个用户平均收益),实现精准的市场营销策略定制。.........

2022-06-16 22:38:12 1097 3

原创 基于机器学习的电信套餐个性化推荐模型的设计与实现

本项目通过数据挖掘技术构建了基于用户消费行为的电信套餐个性化推荐模型,根据用户业务行为画像结果,分析出用户消费习惯及偏好,匹配用户最合适的套餐,提升用户感知,带动用户需求,从而达到用户价值提升的目标。......

2022-06-15 21:54:48 1881 3

原创 基于python的电商运动服饰销售可视化分析系统

本项目基于python网络爬虫从某电商平台抓取所有运动服饰的销售数据,分析不同品牌运动服装价格分布、主流品牌运动服装销售占比、不同标签的运动服装销售占比、男女款式运动服装销售占比等信息,多维度对比各类服装价格的高低。并利用 TensorFlow 构建深度学习模型,实现对运动服饰销售价格的建模和预测。......

2022-06-12 18:25:21 2450 2

原创 基于机器学习的航空公司客户价值分析与流失预测

面对激烈的市场竞争,各个航空公司相继推出了更优惠的营销方式来吸引更多的客户,国内某航空公司面临着常旅游客流失、竞争力下降和航空公司资源未充分利用等经营危机。本项目对某航空公司今年来积累的大量的会员档案信息和其乘坐航班记录,利用RFM模型对客户进行分类,对不同的客户类别进行特征分析,比较不同类客户的客户价值,同时机器学习算法对可能的流失客户就行预测,为航空公司制定相应的营销策略提供支撑。...

2022-06-11 18:05:58 3561 5

原创 基于 Python 的全国空气质量监测与可视化分析平台

空气质量优劣程度与一个城市的综合竞争力密切相关,它直接影响到投资环境和居民健康,因此越来越受到政府和公众的关注。本项目利用网络爬虫从某空气质量监测网站抓取全国各大城市的历年空气污染数据(PM2.5,PM10,SO2,NO2,CO,O3),对全国各城市(空间维度)不同年度(时间维度)等维度进行空气污染物的统计分析,并利用 Echarts 进行可视化展示。...

2022-06-07 19:41:13 6585 1

原创 基于Python的直播平台数据分析可视化系统

本项目利用 python 网络爬虫抓取从某直播平台的直播数据,对不同直播频道数据进行统计分析,同时解析弹幕数据,通过文本清洗、关键词抽取,实现评论词云可视化,并基于 tfidf+情感词典算法实现评论的情感分析。......

2022-05-30 23:45:58 4848 8

原创 基于 Python 的大型超市商品销售关联度分析系统

本项目通过对数据挖掘领域中的关联规则经典算法Apriori,运用关联规则对某大型超市超市的部分数据进行分析、挖掘,判定发现不同类商品之间的关联度,挖掘出商品中隐藏的实用价值,进而在实际销售运作中有效地避免这类错误,给超市提出适当的货架销售建议与货架摆放依据,利于增加超市的运营利润。......

2022-05-29 15:27:50 1961

原创 基于数据挖掘的共享单车骑行数据分析与预测

共享单车系统在大城市越来越流行,通过提供价格合理的自行车租赁,让人们可以享受在城市里骑自行车的乐趣,而无需为自己购买自行车。本项目利用 Nice Ride MN 在双子城(明尼苏达州明尼阿波利斯市/圣保罗市)提供的历史数据。我们将通过查看不同站点的自行车需求、每个站点的自行车流量、季节性和天气对骑行模式的影响,以及会员和非会员之间骑行模式的差异,来探索共享单车骑行数据。

2022-05-29 15:08:26 7203 12

原创 基于机器学习的电影票房分析与预测系统

本项目利用 boxoffice mojo数据集(by IMDBpro)构建票房预测模型,首先将影响电影票房的因素如电影类型、上映档期、导演、演员等量化处理并进行可视化分析。采用多元线性回归模型、决策树回归模型、Ridge regression 岭回归模型、Lasso regression 岭回归模型和随机森林回归模型实现票房的预测,并进行以上模型的 model stacking,实现预测误差的进一步降低。...

2022-05-21 20:17:35 10797 6

基于torchision的图像分类深度学习模型.zip

基于torchision实现的pytorch图像分类功能。利用pytorch实现图像分类,基于torchision可以扩展使用densenet,resnext,mobilenet,efficientnet,swin transformer等图像分类网络。 基础功能利用pytorch实现图像分类 包含带有warmup的cosine学习率调整 warmup的step学习率优调整 多模型融合预测,加权与投票融合 利用flask + redis实现模型云端api部署(tag v1) c++ libtorch的模型部署 使用tta测试时增强进行预测(tag v1) 添加label smooth的pytorch实现(标签平滑)(tag v1) 添加使用cnn提取特征,并使用SVM,RF,MLP,KNN等分类器进行分类(tag v1)。 可视化特征层

2023-10-10

python爬虫教程与常见网站爬虫案例.zip

本节讲解了爬虫的基本流程以及需要用到的 Python 库和方法,并通过一个实际的例子完成了从分析网页,到数据存储的全过程。其实爬虫,无外乎模拟请求,解析数据,保存数据。 当然有的时候,网站还会设置各种反爬机制,比如 cookie 校验,请求频度检查,非浏览器访问限制,JS 混淆等等,这个时候就需要用到反反爬技术

2023-10-10

常用数学建模算法MATLAB实现.rar

具体内容包括: 《MATLAB 神经网络30个案例分析》 《基于MATLAB的高等数学问题求解》 模拟退火算法-最优路径 层次分析法(AHP) 元胞自动机(Cellular Automata) 模糊数学模型(Fuzzy Mathematical Model 目标规划(Goal Programming) 图论(Graph Theory) 灰色系统建模(Grey System) 启发式算法(Heuristic Algorithm) 免疫算法(Immune Algorithm) 整数规划(Integer Programming) 《MATLAB智能算法案例》(Intelligence Algorithm) 插值(Interpolation) 线性规划(Linear Programming) 多元分析(Multivarite Analysis) 神经网络(Neural Network) 非线性规划(Non Linear Programming) 常微分方程(Oridinary Differential Equation) 偏微分方程(Partial Di

2023-10-10

国赛美赛数学建模相关算法 MATLAB实现.rar

本项目为数学建模竞赛中所学习使用的相关算法的MATLAB实现,具体内容包括: 1. 《MATLAB 神经网络30个案例分析》 2.《基于MATLAB的高等数学问题求解》 3.模拟退火算法-最优路径 4.层次分析法(AHP) 5.元胞自动机(Cellular Automata) 6.模糊数学模型(Fuzzy Mathematical Model 7.整数规划(Integer Programming) 8.《MATLAB智能算法案例》(Intelligence Algorithm)

2023-10-10

高端大气-程序员简历模板.zip

程序员简历模板系列。包括PHP程序员简历模板、iOS程序员简历模板、Android程序员简历模板、Web前端程序员简历模板、Java程序员简历模板、C/C++程序员简历模板、NodeJS程序员简历模板、架构师简历模板以及通用程序员简历模板

2023-10-10

Vue-Webpack等前端经典面试题(包含答案).zip

Vue、Webpack、CSS、HTML、JavaScript、性能优化、浏览器等经典前端面试题,包含答案

2023-06-26

MySQL经典面试题(含答案).zip

什么是数据库事务? 事务的四大特性是什么? 事务ACID特性的实现原理? 事务的隔离级别有哪些? 什么是脏读、不可重复读、幻读呢? datetime和timestamp的区别? varchar和char有什么区别? count(1)、count(*) 与 count(列名) 的区别? exist和in的区别? truncate、delete与drop区别? union与union all的区别? group by 和 distinct 的区别? Blob和text有什么区别? 常见的存储引擎有哪些? myisam和innodb的区别? bin log/redo log/undo log是什么? bin log和redo log有什么区别? 说一下数据库的三大范式? 什么是存储过程?有哪些优缺点? 主键使用自增ID还是UUID? 超大分页怎么处理? 一个6亿的表a,一个3亿的表b,通过外间tid关联,你如何最快的查询出满足条件的第50000到第50200中的这200条数据记录。 日常开发中你是怎么优化SQL的? 关心过业务系统里面的sql耗时吗?统计过慢查询吗?对慢查询都怎么优化过? 一

2023-06-26

梯度下降-感知器-神经网络.zip

梯度下降法。神经网络入门:感知器 批量梯度下降 随机梯度下降 多层神经网络。基于Python numpy实现神经网络和梯度下降算法。

2023-06-23

SVM通俗导论-Python代码实现.zip

svm支持向量机python代码。支持向量机(SVM)——分类预测,包括多分类问题,核函数调参,不平衡数据问题,特征降维,网格搜索,管道机制,学习曲线,混淆矩阵,AUC曲线等。

2023-06-23

基于C4.5决策树算法的莺尾花分类识别.zip

本项目基于C4.5决策树算法实现对莺尾花的分类识别。考虑到,花萼长度、花萼宽度、花瓣长度、花瓣宽度均为连续变量,所以需要进行离散化处理;这里通过Gini Index来进行离散化处理,考虑到此次分三类,且通过上面的可视化,三种花在4个属性上分布均存在较大差异,所以对花萼长度、花萼宽度、花瓣长度、花瓣宽度四个属性均采用两个分界点来分成三类。 max_depth = 2 训练集上的准确率:0.964 测试集上的准确率:0.895 max_depth = 3 训练集上的准确率:0.982 测试集上的准确率:0.974 max_depth = 4 训练集上的准确率:1.000 测试集上的准确率:0.974

2023-06-22

机器学习深度学习基础算法知识笔记与案例代码.zip

机器学习深度学习基础算法知识笔记与案例代码 机器学习、深度学习、自然语言处理基础知识总结。 目前主要参考李航老师的《统计学习方法》一书,也有一些内容例如XGBoost、聚类、深度学习相关内容、NLP相关内容等是书中未提及的。 由于github的markdown解析器不支持latex,因此笔记部分需要在本地使用Typora才能正常浏览,也可以直接访问下面给出的博客链接。 Document文件夹下为笔记,Code文件夹下为代码,Data文件夹下为某些代码所使用的数据集,Image文件夹下为笔记部分所用到的图片。 机器学习 线性回归(笔记) 感知机(笔记+代码) KNN(笔记+代码) 朴素贝叶斯(笔记+代码) 决策树(笔记+代码) 逻辑回归(笔记+代码) 最大熵(笔记+代码) SVM(笔记+代码) AdaBoost(笔记+代码) GBDT(笔记+代码) EM算法(笔记+代码) 隐马尔可夫模型(笔记+代码) 条件随机场(笔记) 随机森林(笔记+代码) XGBoost(笔记) 聚类(笔记) 特征工程之特征选择(笔记) 特征工程之降维算法(笔记) 深度学习 神经网络(笔记+代码) RNN

2023-06-22

基于Html-CSS-JavaScript的宇宙科普系统网页设计.zip

基于Html-CSS-JavaScript的宇宙科普系统,网页设计作业全套代码。 超文本标记语言(英语:HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言。您可以使用 HTML 来建立自己的 WEB 站点,HTML 运行在浏览器上,由浏览器来解析。 CSS (Cascading Style Sheets,层叠样式表),是一种用来为结构化文档(如 HTML 文档或 XML 应用)添加样式(字体、间距和颜色等)的计算机语言,CSS 文件扩展名为 .css。 JavaScript 是 Web 的编程语言。所有现代的 HTML 页面都可以使用 JavaScript。

2023-06-22

基于FaceNet和CenterFace实现的人脸识别-课程设计-毕业设计.zip

基于FaceNet和CenterFace实现的人脸识别 使用CenterFace进行人脸检测,获取到五个关键点后,做仿射变换进行人脸对齐。 使用爬虫爬取数据(以明星为目标),对爬取的数据进行 清洗后作为训练集,使用CASIA-FaceV5作为测试集。使用PyQt5开发界面,所有视图均在/src/view,使用MySQL对提取的人脸特征和对应的信息进行存储,使用OpenCV实时采集图像,将采集的图像进行特征向量提取,然后与数据库中的信息比对,根据设置的最大距离来判断是不是同一个人。 运行前先将数据库部署好(src/sql文件夹有sql文件,可直接恢复至数据库),修改好face_db.py中的连接信息,然后运行main.py即可。

2023-06-22

基于Python的酒店信息管理系统-课程设计-毕业设计.zip

基于Python的酒店信息管理系统,包括客房管理、员工管理、报表管理、修改密码等模块。 在经济全球化导致行业竞争愈发激烈的今天,方便快捷的管理手段已经成为各个行 业所迫切需要的要求,酒店作为现代社会行业的实体,更应该通过信息资源的深入开发 和广泛利用,不断提高生成、经营、管理、决策的效率和水平,进而提高酒店的经济效 益和综合竞争力,实现从传统管理向现代管理的转变。 登录功能:登录账号来自于员工账号,最初进入系统的账号来自于员工表,需通过SQL 进行初始化,首页显示找回密码选项,不过尚未开发完毕,修改密码功能设置在登 录成功后的主页中。 员工管理功能:进入员工管理页面可以查看自己的个人信息,包括基本身份信息和 权限信息,1 级权限方可进行添加、删除和修改员工的操作。其中查询员工与修改员工 的功能集成在同一页面,查询到即可修改。删除员工需要提供编号、姓名和身份证号。 添加员工需提供完整注册信息。 客房管理功能:作为酒店工作人员可以查询满足顾客要求的客房信息并办理入住, 入住登记分为个人入住、团队入住和预订入住。预约功能可以帮助个人或团队提前预约, 并可取消预约。退房功能与入住功能类似

2023-06-22

基于KNN算法的MATLAB人脸识别-课程设计.zip

本次实验尝试通过将人脸的图像转化为特征向量,然后训练数据集,通过计算欧拉距离找到与待测人脸最接近的k个人脸,这样对人脸进行归类识别实现一个基于KNN 的人脸识别算法,来达到人脸识别的入门级学习。 算法简介: KNN算法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其 k 个最近邻的训练实例的类别,通过多数表决等方式进行预测。因此,KNN算法不具有显式的学习过程。 KNN算法实际上利用训练数据集对特征向量空间进行划分,并作为其分类的“模型”。 k值的选择、距离度量以及分类决策规则是k近邻算法的三个基本要素。 算法流程: 1.假设有一个带有标签的样本数据集(训练样本集),其中包含每条数据与所属分类的对应关系。遍历训练数据集,计算预测样本与其他每一个样本点的距离,按照由近到远排序。完成训练得到训练后的数据集After training Data Set 2.定义一个KNN参数k 值(1<=k<=20),表示纳入投票决策的样本数 3.输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较(进行测试集的测试)。 4.取前 k个样本数据对应的分

2023-06-22

Java最全面试题宝典.rar

Android(安卓) Android基础知识 Android内存泄漏总结 Handler内存泄漏分析及解决 Handler、Looper、Message、MessageQueue基础流程分析 Android性能优化 ListView详解 RecyclerView和ListView的异同 AsyncTask源码分析 插件化技术 自定义控件 事件分发机制 ANR问题 Art和Dalvik的区别 Android关于OOM的解决方案 Fragment Activity&Fragment SurfaceView Android几种进程 APP启动过程 Activity启动流程以及界面展示过程 图片三级缓存 Bitmap的分析与使用 热修复的原理 AIDL Binder机制 Zygote和System进程的启动过程 Android中的MVC,MVP和MVVM MVP Android开机过程 Retrofit源码分析 Glide源码分析 EventBus用法详解 EventBus源码分析 Android ORM 框架之 greenDAO 使用心得 Data Binding(数据绑定)用户指南

2023-06-20

ChatGPT应用场景与Prompt提示词工程汇总.docx

ChatGPT应用场景与Prompt提示词工程汇总。应用场景包括:01自然语言理解和生成、02写作辅助、03机器翻译、04智能客服、05金融风险控制、06智能广告投放、07智能推荐系统、08情感分析、09语音识别和合成、10数字营销。以及汇总的各种写作、推理等场景下的ChatGPT Prompt提示词工程。

2023-06-20

基于java SSH的校园即时通讯校园帮系统-毕业设计-课程设计.rar

基于java SSH的校园即时通讯校园帮系统。 角色包括管理员和普通用户。管理员功能:登录、公告管理(发布公告、停用公告)、任务管理(下架任务、删除任务)、用户管理(用户充值、限制用户)、修改密码 用户功能:注册、登录、公告中心、任务管理(发布任务、接受任务、完成任务)、个人中心(查看个人信息、修改个人信息、充值管理)、修改密码、评价管理(评价任务、查看评价) 开发环境:jdk1.8+tomcat8.5+mysql5.7

2023-06-20

基于Python的中文内容纠错算法-课程设计

本项目是基于 Python 的中文文本内容纠错算法,基于jieba分词和中文词典技术实现。 中文文本纠错是针对中文文本拼写错误进行检测与纠正的一项工作,中文的文本纠错,应用场景很多,诸如输入法纠错、输入预测、ASR 后纠错等等,例如: 写作辅助:在内容写作平台上内嵌纠错模块,可在作者写作时自动检查并提示错别字情况。从而降低因疏忽导致的错误表述,有效提升作者的文章写作质量,同时给用户更好的阅读体验。 公文纠错:针对公文写作场景,提供字词、标点、专名、数值内容纠错,包含领导人姓名、领导人职位、数值一致性等内容的检查与纠错,辅助进行公文审阅校对。 搜索纠错:用户在搜索时经常输入错误,通过分析搜索query的形式和特征,可自动纠正搜索query并提示用户,进而给出更符合用户需求的搜索结果,有效屏蔽错别字对用户真实需求的影响。

2023-06-20

基于socket tcp通信的多人在线聊天系统-课程设计.rar

Python实现基于socket tcp通信的多人在线聊天系统,包含客户端和服务端。 client.exe client.py requirements.txt server.exe server.py users.txt

2023-06-15

基于Django的网上订餐系统-课程设计.zip

基于python+django的网上订餐系统 开发技术:python+django+mysql 开发工具:pycharm+mysql 主要功能: 普通用户:用户注册,用户登录,加入购物车,购物车结算,退单,查询商品 管理员:用户管理,商品管理,订单管理,购物车管理,退单管理

2023-06-15

基于Python的信息检索与信息抽取系统-课程设计.rar

本项目利用Python实现了一个信息检索与信息抽取系统,包括数据、前端和后端代码。 信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。狭义的信息检索仅指信息查询(Information Search)。即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。又称信息的存储与检索。一般情况下,信息检索指的就是广义的信息检索。 信息抽取 (Information Extraction: IE)是把文本里包含的信息进行结构化处理,变成表格一样的组织形式。抽取系统的输入信息是原始文本,输出的是固定格式的信息点。信息点从各种各样的文档中被抽取出来,然后以统一的形式集成在一起。这就是信息抽取的主要任务。信息以统一的形式集成在一起的好处是方便检查和比较。 信息抽取技术并不试图全面理解整篇文档,只是对文档中包含相关信息的部分进行分析。至于哪些信息是相关的,那将由系统设计时定下的领域范围而定。

2023-06-15

电子科技大学《Python语言程序设计》课后作业和课程设计源代码.rar

电子科技大学《Python语言程序设计》的平时作业和期末课设。

2023-06-15

基于U-Net的细胞数目识别与计数-课程设计.rar

在基于Tensorflow的框架上用Keras进行深度学习对细胞图像分割并利用分割后的图像进行细胞计数。深度学习网络采用 U-Net 神经网络。 原始数据集来自isbi挑战。他提供了tif格式的train,label,test图。但是由于是打包好的30张tif图片,需要先用python的TIFF库对文件进行处理。由于训练图片是30张512×512的数据集,这对于机器学习来说是远远不够的,而且由于本人的硬件环境不太友好。我利用了keras.preprocessing.image一个名为ImageDataGenerator的模块进行图像扭曲来数据扩充。并且将图像转换成256×256的图像后批处理输入网络模型。

2023-06-15

基于Python的学生宿舍管理系统-数据库课程设计-毕业设计.rar

学生宿舍管理系统,使用PyQt5编写,用了pymysql操作mysql库。 学生宿舍管理系统的开发主要包括后台数据库的建立和维护以及前端应用程序的开发两个方面。对于后台数据库的建立和维护要求建立起数据一致性和完整性强、数据安全性好的库。而对于前端应用程序的开发则要求应用程序能提供强大的数据操纵功能,界面友好、使用简单方便等特点。旧的手工纪录的宿舍管理方式已经不能适应高速发展的信息化时代,新的宿舍管理系统开发出来之后,学校的现有的宿舍信息管理将有很大的改观,由过去的人工方式转变为计算机方式,由效率低、数据冗余、易产生错误转变为检索迅速、查找方便、可靠性高、存储量大。

2023-06-15

基于词典方法和机基于器学习方法的中文情感倾向分析系统.zip

文本情感分析又称意见挖掘, 是对包含用户观点、 喜好、 情感等主观性文本进行挖掘、 分析及判别它是一个多学科交叉的研究领域, 涉及概率论、 数据统计分析、 计算机语言学、 自然语言处理、 机器学习、 信息检索、 本体学 ( Ontology) 等多个学科及其相关技术 。 目前, 情感分类大致涌现出两种研究思路:基于情感知识和基于特征。前者主要是基于已有的情感词典或情感知识库 对文本中带有情感或极性的词( 或词语单元) 进行加权求和,而后者主要是对文本提取具有类别表征意义的 特征, 再基于这些特征使用机器学习算法进行分类。 本项目运用情感词典与机器学习两种方法分别进行文本情感分析,并提供结果对比。

2023-06-15

金融计量与量化策略分析-量化投资交易策略分析与系统设计-源代码等资源.rar

本资源包括:中国人民大学财政金融学院刘振亚教授的“金融计量与量化策略分析”与“量化投资交易策略分析与系统设计”两门课程的课程作业和笔记记录。 金融量化分析主要是指以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据当中选出能够带来超额收益的多种“大概率”事件以此来指定策略。主要就是以下几步:灵光乍现、细化策略、策略转程序、检验策略结果、回测、模拟交易、实盘交易等。

2023-06-15

基于python的学生教师刷脸考勤打卡系统-Flask-web-课程设计-毕业设计.rar

基于python的学生教师刷脸考勤打卡系统,包括教师端和学生端,功能主要包括刷脸签到、课程管理、考勤管理等功能模块。 学生可以在闲暇时在系统录入人脸,等到上课签到时,只需在网页上刷脸即可完成签到,签到页实时显示签到人信息,整个过程简便流畅。同时,也实现了与考勤相关的一系列功能,满足用户需求。

2023-06-15

Python+OpenCV 车牌识别【数字图像处理】课程设计毕业设计.rar

近年来,汽车车牌识别(License Plate Recognition)已经越来越受到人们的重视。特别是在智能交通系统中,汽车牌照识别发挥了巨大的作用。汽车牌照的自动识别技术是把处理图像的方法与计算机的软件技术相连接在一起,以准确识别出车牌牌照的字符为目的,将识别出的数据传送至交通实时管理系统,以最终实现交通监管的功能。在车牌自动识别系统中,从汽车图像的获取到车牌字符处理是一个复杂的过程,主要分为四个阶段:图像获取、车牌定位、字符分割以及字符识别。 本代码库主要是使用python环境下的OpenCV来处理图像。

2023-06-15

基于性别网上学习特征分析及可视化系统毕业设计数据挖掘数据分析机器学习【源代码+数据集+视频】.rar

系统演示视频:https://live.csdn.net/v/224436 本项目通过调查问卷获取大学生的网上在线学习的特征数据,利用python分析不同性别在线学习的特征,包括网课类型、行为习惯、学习资源等多维特征,并利用 echarts 进行可视化展示。 1. 问卷提交时间与问卷填写时间与填报方式的分布情况 2. 填报问卷大学生来源城市的分布情况 3. 填报问卷大学生性别与所在年级分布情况 4. 填报问卷大学生所在学校的分布情况 5. 不同性别网上学习是否制定相应的学习目标和任务对比情况 6. 不同性别下载锁屏软件的对比情况 7. 不同性别网上学习时浏览其他网页的对比情况 8. 不同性别网上学习时整理笔记的对比情况 9. 不同性别上网课类型的对比情况 10. 不同性别网上学习的原因的对比情况 11. 不同性别网上学习方式的对比情况 12. 不同性别网上学习遇到困难做法的对比情况 13. 不同性别不错的网上学习资源分享的对比情况 14. 不同性别付费购买正版网课的对比情况 15. 不同性别单次学习时长的对比情况 16. 大学生网上学习特征Kmeans聚类分析结果

2023-06-14

基于性别的大学生浏览视频特征分析及可视化系统【源代码+数据集+视频】.rar

系统演示视频:https://live.csdn.net/v/224431 通过调查问卷获取大学生的浏览视频的数据,利用python分析不同性别浏览视频的特征,包括时长、时段、类型、频率等多维度的特征,并基于 Birch 算法的大学生浏览视频特征聚类分析。 1. 问卷提交时间与问卷填写时间的分布 2. 填报问卷来源饼状图与来源省份分布 3. 不同性别是否经常观看视频对比情况 4. 不同性别观看视频的理由对比情况 5. 不同性别观看时长的对比情况 6. 不同性别观看时段的对比情况 7. 不同性别观看视频类型的对比情况 8. 不同性别观看付费视频的对比情况 9. 基于 Birch 算法的大学生浏览视频特征聚类分析

2023-06-14

密码学加密解密经典算法Python实现课程设计Python.rar

生活中我们经常会遇到一些加密算法,今天我们就聊聊这些加密算法的Python实现。密码学经典加解密算法的python实现,包括:A5加解密、RC4加解密、DES加解密的S盒,P盒等结构、DES核心算法、数字签名、消息认证、Hash算法、RSA加解密等。

2023-06-14

全球各国空气污染指数数据集

该数据集的目标是为不同地区的空气质量提供有价值的见解,使研究人员和政策制定者能够就如何解决空气污染问题做出明智的决定。 该数据集由两个独立的数据集合并而成,一个包含城市及其相应的经纬度坐标信息,另一个包含世界各国的空气污染水平数据。通过结合这两个数据集,我们现在可以分析和比较各国不同城市的空气质量指数。 创建这个数据集的灵感来自于人们对空气污染对我们的健康和环境影响的日益担忧。通过使这些数据易于获取和理解,我希望为改善空气质量和为子孙后代创造一个更清洁、更健康的世界的持续努力做出贡献。 污染指数包括: 1. PM2.5:PM2.5是指空气中宽度小于等于2.5微米的微小颗粒或液滴。吸入时会对人体健康有害,尤其是高浓度时。 2. 臭氧:臭氧是一种可以通过阳光和其他污染物之间的化学反应在大气中形成的气体。高水平的臭氧可能对人类健康有害,尤其是对那些有呼吸道问题的人。 3. 一氧化碳(CO):CO是一种无色无味的气体,由化石燃料的不完全燃烧产生。高水平的一氧化碳对人体有毒,会导致头痛、头晕和恶心

2023-06-12

全球各国家人口数量-截止到2022年11月

美国人口普查局的世界人口时钟估计,截至2022年9月,全球人口为7922312800人,预计到2022年11月中旬将达到80亿。这一总数远远超过了2015年世界人口的72亿。世界人口继续以每分钟约140人的速度增长,大多数国家的出生人数超过死亡人数。 然而,总的来说,几十年来,人口增长率一直在放缓。这种放缓预计将持续到人口增长率在2080-2100年左右达到零(出生和死亡人数相等),人口约104亿。在此之后,人口增长率预计将转为负值,导致全球人口下降。

2023-06-12

AIGC人工智能ChatGPT Reddit 推文数据集

在这里,你可以在Reddit网站上找到大约5万条关于ChatGPT的评论。 这些评论来自4个子版块的Reddit帖子。 数据包括comment_id、comment_pparent_id、comment_body和subreddit comment_id:评论的id commentparent_id:回复当前评论的评论id。 comment_body:注释 subreddit:评论的社区/子版块名称 日期和其他与评论相关的信息将添加到下一版本中。 该数据集有助于深入了解公众对ChatGPT的看法,也有助于文本分析、文本可视化、内联问答、文本摘要、NER和其他任务,如聚类等。 请注意,此数据集未经清理或预处理,因此,如果你想用数据弄脏你的手,也可以提高你的数据清理技能:)

2023-06-09

机器学习数据集文本分类贝叶斯新加坡国立大学-垃圾邮件分类数据集

短消息服务(SMS)消息是一个人通过手机发送给另一个人的短消息。它们代表了一种个人交流方式,是我们当前数字时代的一种重要交流产物。该数据集包含从用户那里收集的短信,这些用户知道他们正在参与一个研究项目,并且他们的短信将被公开共享。该数据集包含两种语言的短信:新加坡英语和普通话。 这是新加坡国立大学计算机科学系为研究而收集的SMS(短消息服务)消息语料库。该数据集由67093条短信组成,这些短信取自2015年3月9日的语料库。这些信息主要来自新加坡人,主要来自就读该大学的学生。这些信息是从志愿者那里收集的,他们知道自己的贡献将公开。数据收集器机会主义地收集了尽可能多的关于消息及其发送者的元数据,以便进行不同类型的分析。

2023-06-09

近30套Echarts大数据可视化大屏代码框架【大屏可视化】Echarts前端

近30套Echarts大数据可视化大屏代码框架,高质量Echarts大屏可视化代码框架,涉及到政务、智慧社区、金融行业、交通、物流、医疗等行业,功能包括实时数据K线图(可自由配置多种行业模式),可切换式大屏展示,翻牌效果,自定义字体等功能。

2023-01-06

基于评论情感分析的酒店推荐系统毕业设计情感分析数据分析网络爬虫【flask web】【源代码+数据集】

利用网络爬虫技术从某旅游网站等爬取成都的景点旅游数据,根据旅游网的数据综合分析成都旅游景点周边酒店住宿,抓取酒店的评论信息,基于机器学习算法实现评论的情感分析,并基于情感分析和其他因素进行酒店的个性化推荐。

2022-07-12

基于排序变换混沌置乱算法的图像加密系统.html

对应博客地址:https://blog.csdn.net/andrew_extra/article/details/125529466 图像信息生动形象,它已成为人类表达信息的重要手段之一,网络上的图像数据很多是要求发送方和接受都要进行加密通信,信息的安全与保密显得尤为重要。本项目利用基于排序变换的混沌置乱算法实现了一个图像加密与解密系统,设计了一个混沌图像置乱算法,新算法不经过量化,而是直接通过混沌序列的排序变换来得到图像置换的地址码,有效地避免了量化必须已知混沌轨道分布密度函数的要求,同时也降低了算法的时间复杂度。系统可方便图片在公开信息通道进行加密传播。 本文利用 html + css + JavaScript 构建了页面友好的图像加密系统(静态页面),加密方式包括:方块混淆、行像素混淆、像素混淆、行模式和行+列模式等五种模式。

2022-07-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除