数据分析
文章平均质量分 70
数据展示、数据挖掘、机器学习...
洗剪吹队长
察理先于形,科学也;先证而后务,数据之用也。
展开
-
若依前后端分离+帆软报表 快速建立网站及后台管理功能
将帆软决策报表嵌入若依后台管理首页,达到快速开发首页仪表板的目的原创 2022-07-12 17:20:51 · 5148 阅读 · 3 评论 -
kettle安装实现windows远程调度linux上的kettle
kettle安装实现windows远程调度linux上的kettle准备:一台windows服务器,一台linux服务器,数据库(作为kettle的工程库),kettle安装包(win和linux通用)windows安装kettle解压kettle安装包到安装目录,找到spoon.bat,打开编辑将红框中参数改为512、512、256,不改可能出现卡顿。改完参数保存,双击spoon.bat运行spoon,会在用户根目录(c:/→用户→User)下生成.kettle文件夹,里面有reposi原创 2021-08-14 09:27:04 · 3408 阅读 · 1 评论 -
tensorflow证件照判断性别
证件照判断性别说明本文用1000张身份证号命名的证件照作为训练数据,复现tensorflow官方教程中的图像二分类例子官方教程地址:https://tensorflow.google.cn/tutorials/load_data/images?hl=zh_cn读取图片import numpy as npimport osimport pandas as pdimport matplotlib.pyplot as pltfrom PIL import Imageimport tensorf原创 2021-06-21 15:53:57 · 516 阅读 · 1 评论 -
关于大学老师‘打分放过率’的研究
关于高校老师‘放过’现象的研究研究背景大学中的课程成绩由平时分与考试分加权后相加得出,平时分包括平时考勤,平时上课表现(回答问题之类)等,考试分是期末考试成绩,大部分老师基本上都是如此。而在教师打这两部分的分时会出现将60分以下且接近60分的成绩,尽量凑成60分的现象(以下称‘放过’现象)。放过现象过少,说明教师过于‘刚正不阿’,增加了自己的挂科率;放过现象过多,说明该老师过于‘仁慈’,教务处应建议该教师整改。所以,在‘仁慈’与负责任之间掌握好尺度,也是教师的一门学问。本文基于某高校某学期的所有学生原创 2021-02-26 12:53:27 · 206 阅读 · 0 评论 -
地铁站点人群复杂度分析,并应用于广告投放
南昌地铁一号线人群复杂度分析(从本人的ppt搬运来的,排版不要好看请谅解)一、分析目标人群组成复杂程度,是精准营销体系中最重要的指标之一,其可以进一步反映人群的年龄组成、消费水平、文化程度等;对地铁站点进行人群复杂程度分析,可以辅助地铁广告投放,公共设施建设,安全监管等业务进行决策;广告投放快餐广告选择“上班族”多的站点进行投放公共设施建设杭州市民中心站“地铁书房”书籍根据人群组成上架不同类型书籍安全监管力度分配针对人群组成复杂的区域适当加大监管力度本文探讨人群复杂程度对地铁广告类原创 2020-12-30 15:11:13 · 894 阅读 · 5 评论 -
用python加机器学习的方法批量判断图片是否有logo
爬来的10w张图片需要放到自家商城上,但其中有图片没加品牌的logo,所以需要先区分图片是否有logo,再加上logo数据准备import matplotlib.pyplot as pltimport tensorflow as tffrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Densefrom tensorflow.keras.preprocessing.image imp原创 2020-05-08 19:50:43 · 801 阅读 · 0 评论 -
matplotlib数据可视化之qq群聊消息统计
作为手边最容易获取的数据 qq群聊消息,拿来练手再适合不过了导出消息在消息管理器中导出txt消息记录结构化数据import matplotlib.pyplot as pltimport reimport matplotlib as mplmpl.rcParams['font.sans-serif'] = ['KaiTi'] # 解决plt无法显示中文问题mpl.rcParams['font.serif'] = ['KaiTi']import pandas as pdfrom pyla原创 2020-05-09 18:46:53 · 448 阅读 · 0 评论 -
k-means算法进行员工培训方向分组
k-means算法进行员工发展潜力分组背景数据集 https://datahack.analyticsvidhya.com/contest/wns-analytics-hackathon-2018-1/您的客户是一家大型跨国公司,在整个组织中有9个广泛的垂直行业。客户面临的问题之一是确定合适的培训方向(仅适用于经理职位及以下职位)并及时做好准备。目前该过程如下:1.收集员工信息2.将员工分组3.分析各组特征,结合实际情况进行培训课制定本篇将进行员工分组及外行肤浅式的特征分析两步数据预处理1原创 2020-05-18 14:57:49 · 601 阅读 · 1 评论 -
keras逻辑回归进行贷款风险预测
analyticsvidhya项目贷款风险预测关于公司Dream Housing Finance公司处理所有房屋贷款。他们遍布所有城市,半城市和农村地区。客户在该公司确认客户的贷款资格后,首先申请房屋贷款。问题公司希望在填写在线申请表时,根据提供的客户详细信息自动进行贷款资格流程(实时)。这些详细信息包括性别,婚姻状况,教育程度,家属人数,收入,贷款金额,信用记录等。为了使这一过程自动化,他们遇到了一个问题,即要确定有资格获得贷款金额的客户群,以便他们可以专门针对这些客户。在这里,他们提供了部分数据原创 2020-05-17 13:30:10 · 636 阅读 · 0 评论 -
python+keras+pandas进行analyticsvidhya项目大型购物中心的销售预测
analyticsvidhya项目大型购物中心的销售预测BigMart的数据科学家收集了2013年不同城市10家商店中1559种产品的销售数据。此外,已经定义了每个产品和商店的某些属性。目的是建立一个预测模型并预测每个产品在特定商店的销售。BigMart将使用此模型尝试了解在增加销售中起关键作用的产品和销售点的属性。请注意,数据可能缺少值,因为某些商店可能由于技术故障而无法报告所有数据。因此,将需要对它们进行相应的处理。数据集:https://datahack.analyticsvidhya.com原创 2020-05-08 19:06:05 · 1110 阅读 · 0 评论