自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(338)
  • 资源 (27)
  • 收藏
  • 关注

原创 【科研数据处理建模】SPSS实战操作生成36类常用论文研究案例,供学习参考

SPSS实战操作0 注意事项1 频数分析表2 交叉分析表3 分组汇总4 正态性检验5 单样本比率检验6 单样本T检验7 配对样本T检验8 两独立样本T检验9 单因素方差分析10 两因素方差分析(无交互作用)11 两因素方差分析(有交互作用)12 多因素方差分析13 协方差分析14 卡方拟合优度检验15 卡方独立性检验16 分层卡方检验17 配对卡方检验和Kappa一致性分析18 单样本wilcoxon检验19 配对样本wilcoxon检验20 Mann-Whitney 检验21 Kruskal-Wallis

2021-06-09 00:47:38 4916 4

原创 【机器学习15】决策树模型详解

决策树算法前言一、决策树算法的概述1.树模型2.树模型基本流程二、熵的作用三、决策树构造实例四、信息增益率和gini系数五、剪枝方法六、分类、回归任务七、树模型的可视化展示八、决策边界展示分析九、决策树预剪枝常用参数十、回归树模型总结前言随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的决策树的详细内容。一、决策树算法的概述1.树模型决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。

2020-09-19 20:12:26 16014 21

原创 【python】将单元格中的多个数据拆分为多行数据(explode方法使用)

单元格多数据拆分1. 背景与需求2. 问题解决2.1 官方示例2.2 实际操作2.2.1 采坑2.2.2 问题纠错3. 问题解决4. 小结1. 背景与需求在处理数据中,往往需要做多维特征提取(一对多),如下:一个企业会有多个擅长领域,为了作多维度数据特征分析,需要将‘企业画像’中单元格的数据进行拆分成为一行一个特征的数据样式,且其他列数据保持不变,简单的demo(以随机两个公司为例)如下2. 问题解决这里需要使用pandas中的explode方法,注意此方法是在0.25.0版本之后才有,所以确

2020-05-23 17:19:30 8682 8

原创 【python】将自定义常用的一些函数封装成可以直接调用的模块方法

将常用一些的函数封装成可以直接调用的模块方法1. 背景2. 具体步骤3. 扩展1. 背景在实际的操作过程中,经常会用到一个功能,如果每次编写代码的时候都进行重新编写或者打开已经编写好的函数进行复制粘贴,这样就显得很麻烦,有没有什么方法可以像导入python模块的那样,直接把要用的函数以模块名+方法的形式调用呢?答案当然是可以的,比如做数据分析时候经常要使用的功能是:实现某一路径下的所有xlsx的合并,文件如下直接给出合并的函数,保留数据格式筛选的接口,将合并后的数据保存在fltered_data文

2020-05-17 17:05:42 12980 11

原创 【python】将python代码打包成系统可执行文件(Pyinstaller模块)

python文件打包输出可执行文件1. Pyinstaller模块下载2. Pyinstaller的使用2.1 打开命令行,指引文件路径2.2 直接生成可执行文件3. 常用指令3.1 修改图标3.2 修改名称3.3 修改路径1. Pyinstaller模块下载关于pyinstaller的介绍这里就不再复制粘贴了,可以自行百度,了解它是可以将python源代码打包成可执行文件的模块即可,打开命令...

2020-05-05 13:24:37 21110 18

原创 【科学文献计量】中英文文献标题及摘要可读性指标分析与可视化

1. 文本可读性指标原理以及计算流程;2.中文文献标题及摘要可读性指标分析与可视化;(a) 按照各指标的均值进行分析(b) 考虑全部的数据,按照指标readability3作为代表进行分析)3.外文文献标题及摘要可读性指标分析与可视化;...

2022-07-16 11:28:28 154

原创 【科学文献计量】中英文文献标题及摘要分词字数与频数统计与可视化

1. 数据读入与字段查看;2.探究文献标题的词汇量分布特征;3.利用计算差异对文献数据格式进行勘误(二分法查找与正则匹配查找);4. 标题、摘要、标题及摘要文本分词频数统计及词云图展示(全部年份和指定年份)...

2022-07-16 11:04:31 96

原创 【科学文献计量】关键词的挖掘与可视化

1.外文文献关键词词频统计与可视化;2.不同期刊的关键词词频统计与可视化;3.中文文献关键词词频统计与可视化

2022-07-16 10:22:13 81

原创 【疑难杂症】matplotlib绘图是设置中文字体为宋体

进行中文宋体的设置

2022-07-04 22:19:00 147

原创 【科学文献计量】外文文献及中文文献关键词的挖掘与可视化

1. 外文文献关键词词频统计与可视化2. 外文文献关键词词频统计与可视化3. 中文文献关键词词频统计与可视化

2022-06-29 20:02:12 124

原创 【科研数据处理】[实践]类别变量频数分析图表、数值变量分布图表与正态性检验(包含对数正态)

对论文中统计分析使用的类别变量和数值变量相关的知识点进行复现实操

2022-06-29 17:08:52 169

原创 【科研数据处理】[基础]类别变量频数分析图表、数值变量分布图表与正态性检验(包含对数正态)

对论文中统计分析使用的类别变量和数值变量相关的知识点进行梳理

2022-06-29 16:51:27 639

原创 【python数据处理】pandas根据多列连续重复值的总和数量判断向新一列添加内容

手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/1252883191 需求假定s是取值与一条1月-12月份的数据,表现了这12个月份人员贷款的状态。输出结果如下:(核实为第一条贷款人员12个月的信息)对列表中的数据进行遍历,然后根据元素的下标依次进行相邻位置的判断,并且要求元素是为“正常”,所以需要添加一个数值累加器,获取连续重复的次数,代码如下输出结果如下:(判断“正常”连续重复元素共5次,与实际情况相符)读入文件,为了方便处理

2022-06-14 23:53:47 195 1

原创 【科学文献计量】标准参考出版年谱(Standard RPYS)和多维参考出版年谱(Multi RPYS)

@[TOC](标准参考出版年谱(Standard RPYS)和多维参考出版年谱(Multi RPYS))1 标准参考出版年谱与多维参考出版年谱1.1 标准参考出版年谱(Standard RPYS)标准参考出版年谱(Standard Reference Publication Year Spectroscopy)是由Marx, Bornmann, Barth, and Leydesdorff(2014)和Marx and Bornmann(2014)提出的一种量化历史出版物对研究领域影响的方法。该方法通

2022-05-25 14:21:55 82

原创 【科学文献计量】知识单元地理数据可视化(作者研究机构点数据和作者所在国家区域面数据)

知识单元地理数据可视化(作者研究机构点数据和作者所在国家区域面数据)知识单元地理数据可视化1.1 地理面数据可视化1.2 地理点数据可视化知识单元地理数据可视化地理数据包含了地理点数据和地理面数据。在文献中,地理面数据表示作者的国家或者区域,地理点数据表示具体的地址,即作者的研究机构所在的地方。1.1 地理面数据可视化重新读入数据,显示前两行,由于字段过多,要找的位置信息字段被省略。为了方便查找作者所在的位置信息,可以通过遍历行和行标题,借助输出提示,找到地址对应的字段名称。确定地理信息所在的字

2022-05-25 14:10:49 71

原创 【科学文献计量】知识单元文献时间序列分析

知识单元文献时间序列分析1 知识单元文献时间序列分析1 知识单元文献时间序列分析数据时间序列分析即是对文献按照某一时间区域划分,进行文献数量统计的过程。即是将知识单元的频次统计按照时间进行分组统计汇总。mk中timeSeries()方法就是针对文献进行时间序列分析,括号中可以传递WOS字段标识,借助DataFrame数据结构,输出按照输入的字段和时间(默认为年份)进行分组汇总的结果。比如将文献按照年份进行分析,探究搜索领域的论文发文量和累计发文量。由于默认汇总结果是按照年份降序排序,但是文章累计量是升

2022-05-25 13:59:34 62

原创 【科学文献计量】知识单元的频次统计与分布(简单阅览和完整频次统计)

知识单元的频次统计与分布1 知识单元的频次统计与分布1.1 知识单元简单阅览1.2 知识单元完整频次统计1 知识单元的频次统计与分布本章中介绍的知识单元,即为WOS字段标识。新建一个ipynb文件,命名为知识单元分析,然后第一步进行功能库的导入。通过以下代码可以加载数据加载与处理,图形表绘制等相关功能库。使用%matplotlib inline命令可以将基于matplotlib生成的图表直接嵌入到Notebook之中,方便分析结果实时出图。代码中存在着.连接,表示使用功能库里面的函数方法,比如sns.

2022-05-25 13:50:14 62

原创 【科学文献计量】CNKI文献Endnote格式数据采集,转化为python中的DataFrame格式,提取算法优化

1 问题今天在进行文献处理的过程中,发现有些文献导出来是的格式有些问题,如下这种现象出现在早期的一些文献中,因此按照原来的方法进行数据的提取,会发现出现很多多余的数据,如下2 问题解决之前的封装的函数def cnki_to_df(folder_path): import pandas as pd import os ls_data = [] for file in os.listdir(folder_path): abs_path = os.p

2022-05-25 11:14:54 37

原创 【疑难杂症】Excel数值自定义显示万,并保留两位小数

Excel数值自定义显示万,并保留两位小数1 网上问题解决2 精度满足1 网上问题解决网上都是直接使用自定义的数值设置,使用 0!.0,!0"万" ,输出的结果如下输出的结果中直接将小数点后的结果给四舍五入了,这里想要的是1223342.36万,样式设置直接给变成了1223342.40万,精度不满足要求。2 精度满足借助于round函数,先对数值进行万的转化,然后再设置万的格式操作如下。完美解决问题(1)函数输入框中:=ROUND(目标单元格/10000,2)(2)自定义输入:0.00万

2022-05-21 17:11:46 975

原创 pandas爬取数据示例网页

pandas爬取数据示例网页排名国家/地区所在洲年份GDP(美元)占世界比重0nan全世界nan202084.75万亿 (84,746,978,784,172)nan11美国美洲202020.95万亿 (20,953,030,000,000)24.7242%2nan欧盟地区nan202015.29万亿 (15,291,934,754,441)18.0442%32中国亚洲202014.72万亿 (14,722,73

2022-05-13 16:51:39 325

原创 【科学文献计量】将Endnote中的文献读入python中进行数据分析,并顺便将结果保存为Excel文件,并封装函数直接调用

将Endnote中的文献读入python中进行数据分析,并顺便将结果保存为Excel文件1 需求2 功能完成2.1 文献下载2.2 文献导入到Endnote2.3 文献导出2.4 文件加载到python中2.5 数据提取2.6 数据简单分析2.7 顺便导出到Excel文件中3 函数封装1 需求在进行文献批量下载导出到Endnote中后,虽然方便我们进行文献的管理以及后续的参考文献的插入,但是对于文献的分析却没有办法直接在Endnote中进行,因此就有需求对于保存在Endnote中的文献读入到pytho

2022-05-07 20:19:33 332

原创 【科学文献计量】Metaknowledge文献数据分析基础(Record、Citation和RecordCollection对象介绍)

Metaknowledge文献数据分析基础5.1 数据分析流程5.2 功能库导入5.3 数据导入5.4 数据异常处理5.5 数据去重5.6 单记录、引文及记录集合分析5.6.1 Record 对象5.6.2 Citation对象5.6.3 RecordCollection对象手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/124546346 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的

2022-05-02 20:53:49 283

原创 【Dash搭建可视化网站】项目8:个人理财管理系统大屏制作步骤详解

项目8:个人理财管理系统大屏制作步骤详解1 运行预览图2 项目架构3 模块介绍3.1 assets和data文件夹介绍3.2主框架搭建1 运行预览图点击中间的账单下拉菜单,选择对应的月份账单,右侧的版面信息会进行相对应的变化。2 项目架构从这个项目开始,代码量就相对较多了,为了避免所有的代码都在一个执行文件下(显着很冗肿,代码可读性较差),在敲代码之前首先需要规划好整个项目的架构布局,代码采用模块化的方式进行设计,具体的项目安排如下:3 模块介绍其中dash-vs-personal-app-t

2022-04-22 23:12:22 595

原创 【python科研数据处理】FuzzyWuzzy模糊匹配在多字段中一一对应匹配的场景应用中拓展(优化)

FuzzyWuzzy字符串模糊匹配算法拓展(优化)1 问题:2 问题解决3 函数完善1 问题:之前在python实现vlookup字符串模糊匹配及在实战中的应用(FuzzyWuzzy库)一文中详细介绍了FuzzyWuzzy的使用,以及封装了模糊匹配的函数,在今天的测试调用中发现了一个问题如下仔细的观察可以发现,这里明明两个字段的数据不是相似或者相同,最后结果竟然匹配上了,原因就是在于之前的那个算法是基于待匹配字段的全部内容(df2),也就是说匹配时是拿左侧的字段的逐一元素(df1),与右侧的待匹配的全

2022-04-21 16:22:34 660

原创 【疑难杂症】sklearn老版本的Imputer和新版本SimpleImputer处理缺失值差异

sklearn老版本的Imputer和新版本SimpleImputer处理缺失值差异0 测试数据1 老版本2 新版本3 问题总结手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/124083243 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息0 测试数据以简单的demo数据为例,如下1 老版本sklearn的版本在0.20以下,安装的方式就为pip install

2022-04-10 19:47:00 454

原创 【疑难杂症】取消pyecharts绘制地图时默认显示小圆点标识

取消pyecharts绘制地图时默认显示小圆点标识1 问题2 问题解决手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/124061946 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息1 问题在使用pyecharts绘制可视化地图信息时候,默认出现的图像是带有圆点标记,比如官网代码运行输出如下:2 问题解决方式一: showLegendSymbol=Falsef

2022-04-09 15:49:08 692

原创 【数学建模】统计领域的逻辑回归(分类变量相关性检验、优势比OR、包含分类变量的多元逻辑回归)

统计领域的逻辑回归0 指导方针1 分类变量之间的相关性检验1.1 分类变量相关性的示例1.2 列联表分析1.3 信用风险建模案例1.3.1 制作两分类变量交叉表并求解交叉频率1.3.2 相关性判定1.3.3 p值与𝛼 显著性水平1.3.4 卡方检验1.4 优势比(Odds Ratios)2 一元连续变量逻辑回归2.1 逻辑回归模型由来2.2 衍生变量生成2.3 数据采样与划分2.4 模型创建2.5 模型预测3 模型表现优劣的评估3.1 一致对于非一致对3.2 ROC曲线与AUC面积3.3 阈值调整与评估指标

2022-04-03 16:10:38 1255

原创 【疑难杂症】PerfectSeparationError: Perfect separation detected, results not available问题解决

PerfectSeparationError: Perfect separation detected, results not available问题解决1 问题背景2 问题解决2.1 百度求助2.2 缺失值查看2.3 分类数据类型干扰2.4 分类数值变量干扰2.5 解决bug3 问题根源3.1 试错1:分类数值中出现小数点试错2:虽然是二分类但不是0-1分类试错3:自变量和因变量完全相关手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/1

2022-04-03 00:05:54 1063

原创 【python数据处理】将DataFrame数据拆解成为一行一行由字典键值对组成的列表

将DataFrame数据拆解成为一行一行由字典键值对组成的列表问题解决拓展问题解决import pandas as pdimport numpy as npdf = pd.DataFrame({'key1':list('abcdef'), 'key2':['hee','fv','w','hija','123',np.nan]})df.to_dict('records')输出结果如下(直接对DataFrame对象进行to_dict,处理的手段采用record

2022-04-01 21:29:37 1311

原创 【python科研绘图】绘制饼图同时显示实际数值和占比情况,最后直接封装为函数调用

绘制饼图同时显示实际数值和占比情况,最后直接封装为函数调用1 需求1 需求在做论文进行分析结果时候,经常用到饼状图,除了显示占比情况和标签外,还想要尽可能多的表现出饼图中的内容,于是就可以加上实际数值和图例,...

2022-04-01 21:10:00 2737

原创 【疑难杂症】根据指定行列生成subplots子图坐标,解决Seaborn子图覆盖问题

根据指定行列生成subplots子图坐标,解决Seaborn子图覆盖问题1 问题说明2 问题解决2.1 Seaborn子图覆盖问题解决2.2 指定行列生成subplots子图坐标问题解决2.3 所有问题解决手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123898527 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息1 问题说明在进行seaborn绘制分类箱型图时,发

2022-04-01 15:44:42 1731

原创 【疑难杂症】利用pandas生成excel中数据保留两位小数及千分位

利用pandas生成excel中数据保留两位小数及千分位案例解决知识点讲解手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123798963 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息案例在实际处理表格的过程中,有时候会需要进行指定位数以及千分位标志的保留。示例如下解决import pandas as pddata = pd.read_excel('dem

2022-03-28 16:58:37 1763

原创 【科学文献计量】CNKI文献Endnote格式数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库

CNKI数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库1 CNKI文献Endnote格式数据采集2 数据加载到python中并进行DataFrame类型转化3 将DataFrame数据存放到MySQL数据库4 将MySQL数据库中的表格读取到python中手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123666179 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于

2022-03-22 18:01:51 803

原创 【科学文献计量】CSSCI数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库

CSSCI数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库1 CSSCI数据采集2 数据加载到python中并进行DataFrame类型转化3 将DataFrame数据存放到MySQL数据库4 将MySQL数据库中的表格读取到python中手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123665894 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意

2022-03-22 17:17:24 1062

原创 【科学文献计量】Scopus数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库

Scopus数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库1 Scopus数据采集2 数据加载到python中并进行DataFrame类型转化3 将DataFrame数据存放到MySQL数据库4 将MySQL数据库中的表格读取到python中手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123665573 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的

2022-03-22 17:09:39 1444

原创 【科学文献计量】PubMed数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库

PubMed数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库1 PubMed数据采集2 数据加载到python中并进行DataFrame类型转化3 将DataFrame数据存放到MySQL数据库4 将MySQL数据库中的表格读取到python中手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123664469 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的

2022-03-22 16:59:24 889

原创 【科学文献计量】Web of Science纯文本数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库

Web of Science纯文本数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库1 Web of Science数据采集2 数据加载到python中并进行DataFrame类型转化3 将DataFrame数据存放到MySQL数据库4 将MySQL数据库中的表格读取到python中手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123664469 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在

2022-03-22 16:49:45 205

原创 【疑难杂症】数据存入Mysql中显示:AttributeError: ‘xxx‘ object has no attribute ‘translate‘ 问题解决

AttributeError: 'xxx' object has no attribute 'translate' 问题解决问题手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123613526 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息问题在使用sqlalchemy将DataFrame数据存放到数据库时候,运行代码后输出结果如下:解决的方式也比较简单,就是把D

2022-03-20 15:11:31 1268

原创 很抱歉,三维地图当前不能在你的国家/地区使用 Excel绘制三维地图问题解决

手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123585838 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息问题之前在利用Excel进行三维地图绘制的时候,一切顺利,很久一段时间没有使用了。今天再使用这和功能发现提示如下的警告。解决方式其实解决起来也很简单:就是把当前电脑的区域设置调整一下即可。步骤如下。在开始菜单输入“区域”,进行搜索,如下然后进入到区

2022-03-18 22:23:55 1859

原创 【SPPS学习一】 SPSS-26软件下载与安装步骤详解

手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123475578 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息SPSS安装以windows系统为例,进行安装讲解,提供的SPSS版本为SPSS-26, 64位的版本,网盘链接如下:链接:https://pan.baidu.com/s/1TN7KtwXJocWCLlTPFeyQww提取码:66661 文件解压文件下载

2022-03-14 12:12:36 5377 4

中国地图绘制的json文件

用于补充【python数据分析】绘制疫情可视化地图、气泡图中地图文件数据

2022-04-21

数据分析师专栏中的机器学习的源代码

针对于博客中评论一直有人需求源代码,这里上传源代码供学习参考,对于数据,也在资源里(数据分析师专栏中的机器学习的补充数据)可以找到,加油学习

2022-04-19

博客中数据分析师专栏,机器学习部分的补充数据文件

博客中数据分析师专栏,机器学习部分的补充数据文件

2022-04-19

大数据实战项代码.zip

大数据实战项目中的代码和web文件中的文件

2021-12-08

opencv人脸识别实战操作.zip

本资源包含了博客:利用open-cv对黄晓明、AB、刘亦菲图片进行人脸识别一文中的所需材料和源代码,用于交流学习,不涉及商业用途

2020-12-14

上海行政区、人口和道路的gis数据.zip

用于博客python数据分析实战中餐馆选址中的数据支撑,包含了上海市行政区、人口和城市道路三个gis数据,可以直接加载

2020-11-25

mysql和navicat.zip

本资源用于博客:Mysql 5.x安装过程梳理中的软件部分,文件中包含了mysql5.540版本的数据库文件和navicat15版本的软件安装包,只用作于学习交流参考。

2020-11-16

时间序列分析.zip

资源是博客:时间特征序列分析汇总(以2021-2019年槽罐车事故数据为例)一文中的数据和ipynb文件,用于对于交流和学习

2020-11-10

贝叶斯新闻分类实战项目文本和停用词数据

本资源是对贝叶斯新闻分类实战项目详解博客一文中的数据资料补充,包含了文本数据,停用词,ipynb文件,仅供读者参考

2020-10-22

信用卡欺诈项目数据和文件.zip

本资源用于博客栏目中的机器学习实例详解中逻辑回归案例模板——信用卡欺诈检测,包含数据和完整的流程ipynb文件

2020-10-09

上海餐饮数据.zip

本数据集作为【python数据分析实战】城市餐饮店铺选址问题(1)—— 对不同菜系进行比较,并筛选出可开店铺的餐饮类型 中的数据支撑

2020-06-16

全国县级边界shp低分辨率.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,属于中国县级地图的json数据格式

2020-05-26

全国市级边界shp高分辨率.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,属于中国市级地图的json数据格式

2020-05-26

virus_data.zip

本资源为博客【python数据分析】详解疫情数据地图可视化步骤一文中的数据来源,供学习参考时候,数据整理不易

2020-05-26

链家网出租房源详细信息

本资源就是作为链家网出租房信息的爬虫数据,旨在用于博客正则表达式分组及pandas实用操作一文的数据来源。

2020-05-23

江苏省科学技术综合奖.zip

本数据为江苏省科学技术综合奖近十年来的全部的获奖人员及详细信息的名单,包含了doc、xls和pdf数据,主要用来做项目分享

2020-05-16

项目:知乎数据.zip

本资源为知乎数据信息爬取,用于做python数据分析实战项目,数据字段包含_id 关注的收藏夹、关注、关注者、关注的问题、关注的话题、关注的专栏、职业1、职业2、回答、提问 、收藏、个人简介、居住地、所在行业、教育经历、职业经历等信息

2020-05-08

数据爬取:六普常住人口数.zip

本资源为全国第六次人口普查各省市常住人口数量,共统计各省市数据量677条,其中包含各省的统计以及其下辖的区县的人口数据 。用于统计分析和数据处理

2020-05-08

机器学习数据.zip

本资源作为专栏机器学习专栏的原始数据,包含了简单的数据,未处理的数据和最终处理完成后的房价数据,用于机器学习相关知识的学习

2020-05-07

项目:电商打折套路解析.zip

本资源为淘宝美妆双十一前后的爬虫数据,时期为11月5-11月14号,作为本博客的python数据分析实战的电商套路分析的数据来源

2020-05-07

项目:国产烂片深度揭秘.zip

本数据资源来源于豆瓣电影数据的爬虫所得,共有数据2458条,作为本博客栏目下的python数据实战分析中国产烂片深度解析的数据来源

2020-05-07

中国全部31个省市区的经纬度信息数据(2020年4月29日爬取)

该压缩包中包含全国各省市区的汇总经纬度数据(精度在小数点5位及以上),还有按照各个省份分别统计的市区县对应的经纬度数据。数据爬取时间为2020年4月29日爬取

2020-04-29

机器学习源码.zip

用于博客中机器学习部分的参考,作为资源的补充,进行知识的分享,资料的运行环境是在jupyter notebook下进行的

2020-04-25

鲁迅对于《祝福》中祥林嫂的情感倾向分析.ipynb

本资源是博客【python舆情分析(5)】 情感倾向分析之鲁迅《祝福》里对祥林嫂(特定人物)的情感倾向 的资料补充,作为学习资料进行参考的

2020-03-26

projects.zip

该资源是作为【机器学习(14)】指定路径下文件的选取、数据缺失值查询及处理、帕累托分析、多文件数据合并与线性回归预测一条龙解析(全过程函数式编程)博客的资源补充

2020-03-19

2_class.rar

这个资源仅用于本博客(【深度学习】利用tensorflow2.0卷积神经网络进行卫星图片分类实例操作详解)的复习分享用,

2020-02-12

auto_office1.zip

用于输出目录所有文件夹这篇文章的示例,读者可以根据文章的内容和代码进行auto_office1.zip压缩文件的使用

2020-01-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除