数据分析
GeekZW
先做后说,说到做到;淡泊明志,宁静致远
唐奖-终身制
展开
-
Python编程题——句式中的指定字符替换
目标:给定句式(含待替换字符)、替换对象与待替换对象的 span,求随机替换N次后生成的数据。并保存为json格式文件。原创 2022-10-17 23:15:18 · 466 阅读 · 0 评论 -
Python——CSV读取大文件报错_csv.Error: field larger than field limit
Python——CSV读取大文件报错_csv.Error: field larger than field limit 使用Python读取较大的csv文件时,可能出现大字段,导致超过字段默认限制,从而无法读取。因此,需要在使用csv读取文件前,先设置下csv字段显示大小。import csvcsv.field_size_limit(500 * 1024 * 1024)for i in range(1, 100): print("开始读取第{0}个".form...原创 2021-03-14 23:19:28 · 1772 阅读 · 3 评论 -
Regexper——正则表达式可视化工具
Regexper——正则表达式可视化工具目标:有时候正则表达式很长,不便于分析与检查,尤其是后期维护费时费力。如果能将正则表达式进行可视化,那么就可以起到事半功倍的效果。Regexper:https://regexper.com 测试用例.*(我想喝|我要喝)(一碗|一杯|一瓶)(一点点|奈雪的茶|喜茶).*|(我想|我要)(吃饭|跳舞|唱歌|拉粑粑).*效果如下图:PS...原创 2020-08-08 00:47:29 · 7463 阅读 · 1 评论 -
Python&Java——循环遍历替换字符串中的部分关键词
Python——循环遍历替换字符串中的部分关键词目标:循环遍历替换字符串中的指定关键词。例子:[时间]我想喝[城市]的[饮品店][时间]: ["今天", "昨天", "明天"],[城市]: ["重庆", "成都", "北京", "深圳"],[饮品店]: ["一点点", "奈雪的茶", "喜茶", "蜜雪冰城"]结果:今天我想喝重庆的一点点今天我想喝重庆的奈雪的茶今天我想喝重庆的喜茶今天我想喝重庆的蜜雪冰城...原创 2020-06-10 21:40:09 · 1796 阅读 · 0 评论 -
Java——正则提取文本中的指定信息
Java——正则提取文本中的指定信息目标:给定正则regex,提取出文本text中的信息。以QQ号码为例。Java代码:import java.util.ArrayList;import java.util.HashMap;import java.util.List;import ...原创 2020-04-19 12:17:30 · 4353 阅读 · 0 评论 -
Python——按比例(随机)划分列表
Python——按比例(随机)划分列表目标:对列表A按比例(随机)划分为子列表A1与A2。代码:import randomdef data_split(full_list, ratio, shuffle=False): """ 数据集拆分: 将列表...原创 2020-04-18 16:19:46 · 16588 阅读 · 3 评论 -
利用Python处理常见文件
利用Python处理常见文件 常见的文件处理包括:txt、csv、json、xml、excel、pkl等等,在做竞赛的时候,数据处理是第一步,总结一点常用到的函数,方便自己查询。一、TXT文件1、定义 txt(text,文本文档)是微软在操作系统上附带的一种...原创 2019-09-08 11:22:27 · 1750 阅读 · 0 评论 -
如何利用软件绘制数学图像中的箭头坐标轴图像?
如何利用软件绘制数学图像中的箭头坐标轴图像?1、 数学软件: Matlab、 Maple2、 画图软件: Graph、 几何画板(强烈建议! )3、 参考网址:(1) Matlab: http://blog.sina.com.cn/s/blog_460be01b0101dmqh.html(2) Graph: https...原创 2019-02-20 12:50:54 · 9466 阅读 · 0 评论 -
如何在kaggle上面快速下载数据?
如何在kaggle上面快速下载数据? 现在做数据科学工作的,大部分都曾在kaggle上下载过数据集,但是最近kaggle好像搞了个API接口,这样很方便下载数据集,具体步骤如下(参考kaggle数据集下载:https://www.cnblogs.com/yuanzhoulvpi/p/8612893.htm...原创 2018-05-02 21:33:21 · 44268 阅读 · 30 评论 -
C++——多项式拟合
C++——多项式拟合目标:利用C++对txt或者xml中的数据,进行高阶或低阶多项式拟合 为方便以后查找,代码以及详细资料已打包,并上传至云盘(链接:https://pan.baidu.com/s/1bvUBIoxv7Avxeq_Cz6xOZQ 密码:u9qe)打包的内容如下: ...原创 2018-07-20 15:37:32 · 15505 阅读 · 6 评论 -
Matlab——离散点的随机区域分配
Matlab——离散点的随机区域分配 假设待定区域现在有200个离散点,我们随机挑选出10个离散点,并以这10个点为中心画半径为R(任意取)的圆。我们知道这10个圆在没有任何交集的情况下,共有1...原创 2018-04-06 11:11:28 · 13308 阅读 · 0 评论 -
机器学习方法汇总——泰坦尼克号之灾难分析
泰坦尼克号之灾难分析整合 背景及方法描述:寒小阳——泰坦尼克号之灾分析包含方法有:Adaboost,GBDT,LR,RF,SVM,VotingC,xgboost等方法。下载链接:点击打开链接或https://pan.baidu.com/s/1xF_0QdiDZIi61kfCp07zMA 密码:7eof文件夹内...原创 2018-05-15 16:38:02 · 3569 阅读 · 1 评论