- 博客(262)
- 收藏
- 关注

原创 用Python进行数据分析:探索性数据分析的实践与技巧
Wes McKinney是Voltron Data的联合创始人兼首席技术官、Python数据社区的活跃成员,同时也是在数据分析、金融和统计计算等领域推广使用Python的倡导者。Wes毕业于麻省理工学院,同时也是Apache软件基金会的Apache Arrow和Apache Parquet项目的项目管理委员会成员。
2023-11-25 17:34:58
3096
172

原创 基于Mapmost Alpha工具快速搭建3D场景可视化大屏
哈喽,大家好!我是小森,今天给大家介绍一款构建3D场景可视化工具——Mapmost Alpha。Mapmost Alpha是Mapmost数字孪生平台下的一个产品,它是一个零代码基础的空间场景轻应用创作平台。
2023-11-23 12:31:50
4126
125

原创 基于Bagging集成学习方法的情绪分类预测模型研究
本研究旨在探讨基于Bagging集成学习方法的情感分类预测模型。通过结合多个基分类器的输出,我们可以期望获得更为鲁棒和泛化能力强的情感分类模型,从而更好地适应不同领域和文本类型的情感分析任务。此外,通过采用Bootstrap采样技术,Bagging还能够有效减少过拟合的风险,提高模型的稳定性。
2023-11-21 17:15:36
5448
133

原创 基于记忆与模型协同过滤的电影推荐系统研究与实践
随着信息技术的不断发展,人们在日常生活中面临着越来越多的选择,例如在电影、音乐、图书等娱乐领域。为了帮助用户更好地发现符合其兴趣和偏好的内容,推荐系统应运而生。推荐系统通过分析用户的历史行为、兴趣和偏好,向用户提供个性化的推荐内容,从而提升用户体验和平台的粘性。
2023-11-16 18:31:25
8284
166

原创 基于LDA主题分析的《老友记》情景喜剧数据集的建模分析
本数据集来源于kaggle,《老友记》是一部美国情景喜剧,由大卫·克兰和玛尔塔·考夫曼创作,于1994年9月22日至2004年5月6日在美国全国广播公司播出,共十季。这部剧由詹妮弗·安妮斯顿、柯特妮·考克斯、丽莎·库卓、马特·勒布朗、马修·佩里和大卫·修默主演,围绕着六个住在纽约曼哈顿的二三十岁的朋友展开。该系列由Bright/Kauffman/Crane Productions与华纳兄弟电视公司联合制作。最初的执行制片人是凯文·s·布莱特、考夫曼和克兰。
2023-11-12 12:11:57
7715
194

原创 基于情感分析+聚类分析+LDA主题分析对服装产品类的消费者评论分析
本研究旨在通过对服装产品类的消费者评论进行综合分析,为企业提供更全面、更深入的市场洞察和决策支持。同时,本研究的方法和结果也可以为其他领域的消费者评论分析提供借鉴和参考。
2023-11-09 14:09:42
11159
173

原创 数据分析案例-基于服饰行业中消费者行为和购物习惯的可视化分析
本实验旨在借助可视化分析工具,深入探讨服饰行业中的消费者行为和购物习惯,以便制定更精准的市场策略和决策。
2023-11-06 16:33:55
8885
208

原创 分享Python7个爬虫小案例(附源码)
本次的7个python爬虫小案例涉及到了re正则、xpath、beautiful soup、selenium等知识点,非常适合刚入门python爬虫的小伙伴参考学习。
2022-10-22 07:00:00
95990
200
原创 作为开发者如何有效使用 ChatGPT
随着技术的不断进步和应用的不断扩展,ChatGPT将在更多领域发挥重要作用,如智能客服、智能家居、自动驾驶等。作为开发者,有效使用ChatGPT可以提高我们的工作效率和创造力。通过制作准确的提示词和利用ChatGPT在实际场景中的应用,我们可以更好地发挥其优势,应对挑战,并探索未来的发展潜力。本文只是从几个常用的场景来介绍开发者如何有效利用chatgpt,当然它还有很多功能等待开发者去探索发现。
2023-10-31 17:32:42
10287
235
原创 【SPSS】基于RFM+Kmeans聚类的客户分群分析
随着行业竞争越来越激烈,商家将更多的运营思路转向客户,客户是企业生存的关键,能够把握住客户就能够掌控企业的未来。客户的需求是客户消费的最直接原因,因此我们主要研究以下问题:1)企业如何细分客户;2)哪些是重要的保持客户;3)哪些是发展客户;4)哪些是潜在客户。从而针对不同客户群体定制不同的营销策略,使企业利润最大化。最后我们将客户群按价值高低进行分类和排名,客户群1是潜在客户;客户群3是一般发展客户,客户群2是一般保持客户,客户群4是重要保持客户。RFM聚类类别客户类别客户数排名。
2023-10-29 12:41:33
9454
188
原创 数据分析案例-某公司员工数据信息可视化
本次实验旨在通过可视化工具和技术,分析和呈现公司员工数据信息。这种数据可视化对于公司管理和决策制定非常重要,可以帮助领导层更好地了解员工情况,优化流程,提高效率,和制定人力资源策略。
2023-10-26 11:22:53
10762
160
原创 Comate SaaS版:开发者的梦想工具终于来了
百度Comate的推出将极大地改变我们的编程方式。它可以帮助我们快速理解新代码,提高编程速度和效率。同时,它还可以自动优化代码,减少潜在错误并自动修复,使我们的代码更加健壮和高效。我想说的是,编程是一个不断追求高效、高质量的工作。而百度Comate代码助手的推出正是为广大的企业和开发者提供了一个更加智能化、高效化的编程工具。无论你是一名开发者还是一家企业,Comate都将成为你的得力助手,助力你更高效地进行编程工作。不要错过这个编程革命的机会,前往官方网站立刻体验吧!
2023-10-24 16:00:02
12145
111
原创 数据分析案例-顾客购物数据可视化分析
本项目旨在通过数据可视化技术,对顾客购物数据进行深入挖掘和分析,为商家提供全面的市场分析和商业洞察。通过使用先进的数据可视化工具和技术,我们将从大量的顾客购物数据中提取有价值的信息,并通过直观的图形展示出来,帮助商家更好地理解市场和消费者行为,优化商业决策。
2023-10-22 08:53:32
9481
257
原创 从文字到视频:借助ChatGPT与剪映轻松生成高质量视频
随着社交媒体的普及和视频平台的兴起,越来越多的人开始关注如何制作高质量的视频内容。而现在,借助ChatGPT生成优质文案和剪映的图文生成视频功能,即使是零基础的普通用户也能够轻松制作出高质量的视频,成为视频博主。这种趋势的出现,一方面是由于技术进步和人工智能的发展。ChatGPT作为一种自然语言处理技术,可以理解和生成人类语言文本,并借助大规模语料库的训练,生成高质量的文本内容。而剪映的图文生成视频功能则利用了深度学习和计算机视觉技术,将文字和图片转换成视频形式,大大降低了视频制作门槛。
2023-10-18 09:11:16
11114
184
原创 数据分析案例-基于snownlp模型的MatePad11产品用户评论情感分析
在本次实验中,我们采用了先进的文本挖掘和数据分析技术,对京东平台上MatePad11的用户评论进行了全面深入的分析。通过使用Python编程语言,我们首先实现了自动化爬取用户评论的关键信息,并将这些数据进行了预处理。预处理阶段,我们采用了自然语言处理技术,对文本进行了清洗、分词、词性标注等操作,为后续的数据分析奠定了基础。此外,我们还运用了情感分析算法,对用户评论的情感倾向进行了自动分类,以便更好地把握用户对该产品的态度和感受。在进行数据预处理之后,我们进一步对用户评论数据进行了可视化分析。
2023-10-16 16:51:29
10264
247
原创 使用Python获取某会计协会网站的文章并保存在本地
由于业务原因,需要经常关注`“北京注册会计师协会”`网站`“最新公告”`栏目里的`“北京注册会计师协会专业技术委员会专家提示”`相关文章。不想每次进网站一个一个地点击,然后复制到word文件。如果能一次批量爬取,并存到word文件就好啦。
2023-10-13 09:38:22
9998
162
原创 【办公自动化】在Excel中按条件筛选数据并存入新的表2.0
去年共有278天领用了物料,记录在278张Excel表中。现在,老板想将所有物料按领用量从高到低排序,以便查看前10种领用最多的物料的情况。如果手工操作,需要把每张工作表的内容合并在一起,再用数据透视表来做。而对于这种重复操作,Phthon最擅长。
2023-10-11 09:48:54
10684
174
原创 【办公自动化】用Python按时间分割txt文件中的数据
现在要求按小时将数据提取,并存为新的txt文件,也就是1天会对应有24个txt文件。先整理一下思路:1. 读取数据2. 将每行数据的时间戳转换成“日期-小时”格式,并按此分类数据,存入字典3. 按“日期-小时”分断,将写入数据到新的txt文件
2023-10-09 22:17:16
10881
146
原创 人工智能驱动的古彝文识别:保护和传承古彝文文化
在2022年人工智能大会上,合合信息使用智能文字识别技术挑战钟鼎文识别,实实在在秀了一把“肌肉”。钟鼎文的识别,是合合信息继挑战识别甲骨文后追求的新挑战。现阶段,合合信息开启了古彝文识别项目。古彝文识别对于彝族文化的传承和传播具有重要意义。通过古彝文识别,可以深入研究和理解彝族文化的历史、传统、信仰、文学、艺术等方面,促进彝族文化的传承和发展。同时,古彝文识别也可以为彝族文化的传播提供支持和帮助,让更多人了解和认识彝族文化的独特魅力。
2023-10-07 08:56:48
12706
162
原创 【办公自动化】在Excel中按条件筛选数据并存入新的表
老板想要看去年每月领料数量大于1000的数据。手动筛选并复制粘贴出来,需要重复操作12次,实在太麻烦了,还是让Python来做吧
2023-10-02 16:50:34
11195
112
原创 【办公自动化】用Python将PDF文件转存为图片
因工作中的某些奇葩要求,需要将PDF文件的每页内容转存成按顺序编号的图片。用第三方软件或者在线转换也可以,但批量操作还是Python方便,所谓搞定办公自动化,Python出山,一统天下;Python出征,寸草不生~ O(∩_∩)O
2023-09-27 14:11:29
10624
160
原创 【办公自动化】使用Python一键往Word文档的表格中填写数据
在工作中,我们经常遇到将Excel表中的部分信息填写到Word文档的对应表格中,以生成报告,方便打印。今天我们就来试试如何往固定的Word模板中填写数据。此例要求将Excel档的“收货数据”填写到Word档的“收货记录”中去,并加总收货数量。
2023-09-25 18:23:27
11491
182
原创 数据分析方法-对比分析和用户画像
本文主要介绍数据分析方法中的对比分析和用户画像。这是一本从功能模块、技术实现、平台构建、业务应用4个层次由浅入深地讲解用户画像的著作。作者在某头部互联网公司经历了其用户画像平台从0到1并发展为画像中台的全过程,打下了扎实的技术功底,积累了丰富的业务经验,本书从技术和业务双重维度对整个过程进行了复盘。具体来讲,本书主要包含如下内容:(1)画像的作用、业界主流的4种商用画像平台的核心功能和实现逻辑;(2)画像平台的主要功能、画像平台的技术架构与技术选型、画像平台的数据模型;
2023-09-21 12:21:29
10641
83
原创 用Python分析文本数据的词频并词云图可视化
上次批量提取了上市公司主要业务信息,要分析这些文本数据,就需要做文本词频分析。由于中文不同于英文,词是由一个一个汉字组成的,而英文的词与词之间本身就有空格,所以中文的分词需要单独的库才能够实现,常用的是`jieba`。
2023-09-20 09:48:06
10837
167
原创 【办公自动化】用Python在Excel中查找并替换数据
随着项目的进展,需要经常在Excel业务表格中查找及替换数据,已保证数据与实际项目进度一致。手动一个一个查找,然后替换,效率太低,还容易遗漏。现在我们来试试用Python自动完成查找及替换吧。
2023-09-17 09:25:46
9806
186
原创 【办公自动化】用Python批量从上市公司年报中获取主要业务信息
要求批量从上市公司年报中截取公司从事的主要业务信息,以便进行后续的分析。首先我们要分析一下上市公司年报的结构,及目标信息所在位置。一般上市公司的年报都是公开的,可随意下载。其格式一般是PDF。年报内容包含的板块几乎相同,只是深圳市场与上海市场略有区别。
2023-09-14 14:29:01
9305
105
原创 大数据分析案例-基于随机森林算法构建二手房价格预测模型
通过应用随机森林算法,我们希望建立一个能够有效预测二手房价格的模型。这个模型可以基于各种因素,如区域位置、房屋属性、市场供需等,来预测未来某一时间点的房价。通过提高预测准确性,我们可以更好地把握房地产市场动态,为决策提供更有价值的参考。揭示影响二手房价格的因素及其影响方式:通过分析随机森林算法生成的模型,我们可以进一步了解哪些因素对二手房价格有重要影响,以及这些因素如何影响房价。这有助于我们深入理解房地产市场的运行规律,为制定更为有效的市场策略提供依据。
2023-09-10 11:57:08
10445
108
原创 ChatGPT:深度学习和机器学习的知识桥梁
ChatGPT,即“Chat Generative Pre-trained Transformer”,是一种基于深度学习的自然语言处理模型,由OpenAI开发。这个模型的独特之处在于它的能力,可以生成自然、流畅的文本,仿佛是来自一个有思维的聊天伙伴。ChatGPT的工作原理基于Transformer架构,这是一种在自然语言处理领域取得巨大成功的架构。
2023-09-06 14:11:17
9624
208
原创 探索iVX:颠覆传统低代码平台的新潮流
iVX低代码平台代表了低代码开发的新潮流,与传统低代码平台有着明显的区别。它不仅提供了可视化开发的便利性,还支持生成全栈代码,允许程序员保持编程逻辑的完整性。此外,iVX还具备丰富的自定义能力,包括自定义组件、函数、JSON代码、SQL语法等,使开发人员能够根据需求添加自己的代码。iVX还拥有一个丰富的应用商店,为开发者提供各种应用模板,加速应用开发过程。总之,iVX低代码平台为企业和开发者带来了更高的灵活性、效率和创造力,是现代应用开发的一大利器。感兴趣的小伙伴快去试试吧!
2023-09-04 17:28:08
9530
117
原创 【机器学习】人工智能概述
机器学习和人工智能,深度学习的关系人工智能(AI):人工智能是一门研究如何使计算机能够模拟、理解和执行人类智能任务的学科。它的目标是让计算机具备类似于人类的智能水平,可以进行推理、学习、感知和决策。机器学习:机器学习是人工智能的一个重要分支,它是让计算机通过从数据中学习和提取模式,自动改进执行特定任务的能力。在传统编程中,程序员需要明确指定计算机应该如何执行任务,而在机器学习中,计算机通过学习数据的规律和特征自主地进行任务执行,这种方式使得计算机在面对新的情况时也能做出合理的决策。
2023-09-04 12:28:46
10925
158
原创 【办公自动化】使用Python批量处理Excel文件并转为csv文件
今天一位正在国企实习的朋友突然私信找到我,说领导派了个离谱的活,大概就是需要将一个大文件夹里面的excel文件进行简单处理后再转为csv格式的文件,然后这个大文件里面有五个二级文件夹,这五个二级文件夹里面都有一个三级文件夹,然后每个三级文件夹里面都有14-18个四级文件夹,每个四级文件夹里面有31个excel文件和极少量csv文件夹。听起来层级是不是特别饶,而且加起来总共有2000多个excel文件。处理的话是将表格中的时间列格式进行转换,最后存储为csv文件。
2023-08-30 18:43:38
9754
119
原创 数据分析案例-汽车客户信息数据可视化分析
本数据集来源于kaggle,原始数据集共有8068条,11个特征变量,各变量含义解释如下:ID:客户IDGender:客户性别Ever_Married:客户婚姻状况Age:客户年龄Graduated:客户是毕业生吗?Profession:客户的职业Work_Experience:多年工作经验Spending_Score:客户的消费评分Family_Size:客户家庭成员人数(含客户)Var_1:客户的匿名类别Segmentation:(目标)客户的客户群。
2023-08-25 18:47:30
10575
203
原创 大数据分析案例-基于LightGBM算法构建糖尿病确诊预测模型
本研究旨在基于LightGBM算法构建糖尿病确诊预测模型,通过分析临床数据中的生物特征、生活习惯、家族病史等因素,实现对患病风险的预测。通过该模型,可以为医生提供更多的客观数据支持,帮助其做出更准确的诊断和治疗决策,同时也可以为患者提供个性化的健康管理建议,从而有效降低糖尿病的发病率和并发症风险,改善患者的生活质量。本研究旨在基于LightGBM算法构建糖尿病确诊预测模型,通过分析临床数据中的生物特征、生活习惯、家族病史等因素,实现对糖尿病患病风险的预测。
2023-08-23 11:43:48
8006
49
原创 数据结构与算法:通往编程高地的必修课
计算机科学的奥秘,就藏在那些看似晦涩的代码和算法背后。你是否曾因数据结构与算法而感到困惑?是否觉得它们彼此纠缠,难以分辨?别担心,今天我们将为你揭开这个谜团,深入探讨它们之间的联系与共生。
2023-08-23 11:39:24
8060
140
原创 【办公自动化】使用Python批量生成PPT版荣誉证书
使用Python处理PPT文件通常需要使用第三方库来简化对PPT文件的读取、写入和修改操作。下面介绍一些常用的Python库和它们的功能:python-pptx:这是一个流行的Python库,用于创建、读取和修改PPTX(Office Open XML格式)文件。您可以使用它创建新的幻灯片、添加文本、图像和形状,还可以修改幻灯片的样式和布局。python-pptx-template:这个库在python-pptx的基础上增加了对模板的支持。您可以使用预定义的PPTX文件作为模板,然后在模板的基础
2023-08-19 09:07:07
8843
83
原创 搞懂大模型的智能基因,RLHF系统设计关键问答
RLHF(Reinforcement Learning with Human Feedback,人类反馈强化学习)虽是热门概念,并非包治百病的万用仙丹。本问答探讨RLHF的适用范围、优缺点和可能遇到的问题,供RLHF系统设计者参考。强化学习利用奖励信号训练智能体。有些任务并没有自带能给出奖励信号的环境,也没有现成的生成奖励信号的方法。为此,可以搭建奖励模型来提供奖励信号。在搭建奖励模型时,可以用数据驱动的机器学习方法来训练奖励模型,并且由人类提供数据。
2023-08-18 19:00:00
9193
147
原创 图像处理的未来:揭秘扫描全能王的AI驱动创新
近期,合合信息旗下扫描全能王推出全新功能“智能高清滤镜”,从8月15日起正式上线。这一功能不同于传统扫描软件,使用时无需考虑拍摄角度、光源等因素,因为它能智能检测图像问题,自动优化处理,解决模糊、阴暗等难题。这项创新得益于智能扫描引擎AI-Scan,从图像处理、文字识别到版面还原,AI-Scan用智能的方式检测、解决图像问题,实现所拍即所得的效果,为生活和生产中90%的扫描难题提供一键解决方案。这一功能代表了AI技术在图像处理领域的巨大进步,为用户带来更智能、更精准的图像处理体验。
2023-08-17 09:13:32
12827
132
原创 大数据分析案例-基于KMeans和DBSCAN算法对汽车行业客户进行聚类分群
本实验旨在通过对汽车行业客户数据进行分析,找出不同客户类型的属性和行为特征,最后使用KMeans聚类算法进行聚类分群,根据客户的特点量身定制产品和服务,提高客户满意度和忠诚度,增加销售额,并在激烈的市场竞争中取得优势。针对以上四个细分类别的汽车行业客户,可以制定相应的精准营销策略,以满足不同客户群体的需求和偏好,提高市场营销效果。1. 细分D:年龄在35岁以下的未婚人士,消费得分低,主要在医疗保健行业工作。- 营销策略:针对这一群体的客户,可以推出经济实惠的汽车型号,注重车辆的安全性和燃油经济性。
2023-08-14 15:11:52
8107
104
原创 基于Python爬虫+词云图+情感分析对某东上完美日记的用户评论分析
随着互联网和社交媒体的发展,用户评论成为了消费者表达自己意见和情感的主要途径之一。对于企业来说,深入了解用户对其产品或服务的看法可以帮助他们更好地了解市场需求、产品改进的方向,以及消费者的情感倾向。因此,对用户评论进行分析已经成为了市场研究和商业决策的重要手段之一。
2023-08-10 22:10:23
10670
111
原创 问世28年经久不衰,大厂为何独爱这门技术?
缺什么网购商城就推什么想吃瓜瞬间就弹出相关新闻想打卡的餐厅神速推出优惠团购……这大概是很多网民的日常——感觉大脑被装了监视器!其实,在每一次浏览中,推荐系统的作用都举足轻重!它就好像掌握了“读心术”的AI,时时刻刻给你推荐感兴趣的内容。自1994 年美国明尼苏达大学研究组推出第一个自动化推荐系统GroupLens,距今已有 29 年。得益于腾讯、YouTube、快手等公司在推荐、广告等业务场景中的应用,当下推荐系统已经进入蓬勃发展、百花齐放的新时代,甚至已经有研究人员试图。
2023-08-09 12:48:56
8285
189
chatgpt接入微信公众号代码+教程.rar
2023-05-14
Python爬虫-前程无忧大数据相关岗位信息.rar
2023-01-19
基于随机森林算法预测人类预期寿命-课程设计.rar
2023-01-13
Scrapy微博爬虫-根据关键词爬取相关微博帖子信息
2023-01-12
基于机器学习人工智能助力金融反欺诈学术论文.rar
2023-01-12
HTML+CSS+JS构建大数据相关招聘信息可视化大屏
2023-01-12
Flask+vue2电商后台管理信息系统
2022-10-28
Flask搭建简易版论坛社区
2022-10-28
Flask搭建简易版个人博客网站
2022-10-28
Flask搭建豆瓣Top250可视化网站
2022-10-28
Python爬虫+Flask+Echarts构建全疫情实时可视化大屏
2022-10-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人