数据处理
xz1308579340
这个作者很懒,什么都没留下…
展开
-
利用python做中文词频分析
利用python做中文词频分析 摘要:利用python做中文词频 分析,分析文本中词频出现的次数,文本可以保存在TXT或者CSV文件中,用到csv库和正则表达式。需要有文本处理和正则表达式的基础,不会请先学习这方面内容。 导入库:# coding=utf-8 编码形式import sys #字符串处理方式import re原创 2017-03-27 16:24:09 · 25951 阅读 · 1 评论 -
python-按比例将子文件划分为train data和test data
python-按比例将子文件划分为train data和test data程序目的:将data划分为测试集和训练集: 原始数据存放位置:./data/danzi/测试集位置:./data/danzi-test/训练集数据存放位置:./data/danzi-train/按照0.7:0.3划分测试集和训练集程序步骤:1.读取所有data2.打乱数据3.对原创 2018-01-24 19:18:49 · 9437 阅读 · 2 评论 -
kaggle入门之泰坦尼克幸存预测
kaggle入门之泰坦尼克幸存预测#数据集什么的就不介绍了,官网上都有主要的工作步骤1.提出和定义问题 2.获取训练和测试数据 3.获取,准备和清洗数据 4.分析,识别,探究数据 5.建模,预测并解决wenti 6.可视化,报告和解决 7.应用和提交结果数据分析和整理#数据分析整理# data analysis and wranglingim...原创 2018-09-15 18:03:34 · 300 阅读 · 0 评论