读取文件行并分割行中字符串:C/C++以及python实现

原创 2013年05月22日 11:16:49

一、问题描述


给定一文件,依次读取文件中各行的字符串(字符串之间以空格分开)

例如:文件test.txt中有如下内容:

first  second  third  forth  (第一行)

fifth  sixth seventh   (第二上)

... (其他行)

则读取的内容依次为:   first  second  third  forth   fifth  sixth seventh


二、解题步骤


(1)首先读取文件各行

(2)然后针对每行依次读取各个字符串

(3)最后将读取的字符串依次存入内存中


三、编程实现


1、C语言实现

在C语言中,有个函数:strtok() 用于分割字符串,其原型如下:

#include <string.h>
char* strtok(char str[], const char* delim);

说明

I、参数:str为待分割的字符串;delim为分隔符字符串。

II、用法:该函数的使用比较奇特,若在str字符串中发现参数delim中的分割字符串之字符时,则会将该字符修改为‘\0’字符(字符串结束符)。在第一次调用时,strtok()必须给予参数str字符串,下次调用时则须将str设置成NULL。每次调用成功则返回指向被分割出片段的指针。

例子

#include <stdio.h>
#include <string.h>
int main()
{
	char s[] ="ab|cdef;ghi|jkl";
	char* delim = "|;";
	char* tmp;
	tmp = strtok(s, delim);
	while(tmp != NULL)
	{	
		printf("%s\n",tmp);
		tmp = strtok(NULL, delim);	
	}

	return 0;
}

输出



下面给出读文件各行中的字符串,并将其保存于内存中。设文件名为:test.txt,其内容如下:


对应的程序为:

#include <stdio.h>
#include <string.h>

/*
@in, str: 待分割的字符串
@in, delim: 分隔符字符串
@in_out, dest: 保存分割后的每个字符串,设为char**的引用,即表示可修改其值
@out, pCount: 记录一行中分割所得字符串的个数
*/
void split(char* str, char* delim, char** &dest, int* pCount)
{
	char* tmp;
	*pCount=0;
	if(NULL ==  str || 0 == strlen(str)) return ;
	if(NULL == delim || 0 == strlen(delim)) return ;

	tmp = strtok(str, delim);
	while(tmp != NULL)
	{	
		for(int j =0; tmp[j]!='\0';j++)
		{
			if(tmp[j]=='\n')break; //到达行末
			(*dest)[j] = tmp[j];
		}
		(*dest)[j]='\0';
		dest++;	
		(*pCount)++;

		tmp = strtok(NULL, delim);
	}
}
int main()
{

	FILE* fp;
	char lineBuf[129];
	char* delim = " ";	//分隔符为:空格
	int num = 0;	//文件中总的字符串个数
	int count = 0;	//一行中的字符串个数
	int i;

	/*申请内存用于存放字符串*/
	char** dest  = new char*[128];
	for( i = 0; i < 128; i++)
	{
		dest[i] = new char[64];
	}

	char** tmpDest = dest;
	if(fp=fopen("test.txt", "r"))
	{	
		while(fgets(lineBuf, 128, fp) != NULL)
		{
			split(lineBuf, delim, tmpDest, &count);
			num  = num + count;
		}
	}
	fclose(fp);

	for(i= 0; i < num; i++)
	{
		printf("%s\n",dest[i]);
	}

	/*释放内存*/
	for(i = 0; i<128;i++)
	{
		delete []dest[i];
	}
	delete[]dest;

	return 0;
}


2、C++语言实现

C++中没有实现split功能的函数,下面用C++ STL中的一些函数模拟实现split功能。

#include <iostream>
#include <string>
#include <vector>
#include <fstream>
using namespace std;

/*
@in, src: 待分割的字符串
@in, delim: 分隔符字符串
@in_out, dest: 保存分割后的每个字符串
*/
void split(const string& src, const string& delim, vector<string>& dest)
{
	string str = src;
	string::size_type start = 0, index;
	string substr;

	index = str.find_first_of(delim, start);	//在str中查找(起始:start) delim的任意字符的第一次出现的位置
	while(index != string::npos)
	{
		substr = str.substr(start, index-start);
		dest.push_back(substr);
		start = str.find_first_not_of(delim, index);	//在str中查找(起始:index) 第一个不属于delim的字符出现的位置
		if(start == string::npos) return;

		index = str.find_first_of(delim, start);
	}
}


int main()
{
	ifstream infile("test.txt", ios::in);
	vector<string> results;
	string word;
	string delim(" ");
	string textline;
	if(infile.good())
	{
		while(!infile.fail())
		{
			getline(infile, textline);
			split(textline, delim, results);
		}
	}
	infile.close();

	vector<string>::iterator iter = results.begin();
	while(iter != results.end())
	{
		cout<<*iter++<<endl;
	}

	return 0;
}


3、Python语言的实现

在Python中有专门的函数split()对字符串进行分割,实现较为简单

myfile = open('test.txt', 'r')
allWords = []
line = myfile.readline()
while line:
	list = line.split(' ')
	for word in list:
		if word[-1]=='\n':
			allWords.append(word[:-1])	#去掉行末的'\n'
		else:
			allWords.append(word)
	line = myfile.readline()
myfile.close()	
print allWords


References:


1、c/c++实现split分割字符串 - 罗素实验室

2、strtok函数 - 百度百科

python--高效率文本操作

要写一个脚本进行简单的但是非常多的事情:即从一个文本文件中读出文本然后将其中的空格替换成分号。很简单的脚本但是可以体现脚本的强大。一、将下面的文本中你的空格符号替换成分号 二、写一段脚本#-*—co...
  • qq_28877125
  • qq_28877125
  • 2017年06月24日 17:13
  • 264

C++按行读取文本文件,并通过分隔符取值

C++按行读取文本文件,并通过分隔符取值!
  • gx_489587482
  • gx_489587482
  • 2016年11月26日 22:20
  • 1189

python Pandas 读取txt表格

运行环境Python 2.7 操作实例1.原始文本格式:空格分隔的txt,例如 1 2016-03-22 00:06:24.4463094 中文测试字符 2 2016-03-22 ...
  • u011077672
  • u011077672
  • 2016年03月23日 09:50
  • 25338

python:读取文本文件的行数据,文件.splitlines()

一般跟踪训练的ground_truth的数据保存在文本文文件中,故每一行的数据为一张图片的标签数据,这个时候读取每一张图片的标签,具体实现如下: test_txt = '/home/zcm/te...
  • xuan_zizizi
  • xuan_zizizi
  • 2018年01月18日 10:48
  • 255

python 对以空行作为分割的块文件进行读取的方法

使用python读取以空行为分块形式的txt文件
  • u010970698
  • u010970698
  • 2017年08月28日 10:10
  • 766

python读取字符串按列分配后按行读出

问题: 输入一个字符串和一个数字,数字代表分为几行,需要按照给定的列存储方法存储下来之后按行拼接读出,如: 输入:TNGDWXAZQSCVBK,3 输出:TWQBNDXZSVKGAC 中间转化...
  • Together_CZ
  • Together_CZ
  • 2017年08月04日 21:26
  • 989

C语言中通过分隔符来截取字符串

最近在工作中要实现这样一个功能: 从一个文本文件中按行读取数据,一行数据中每一列都可能含有空格,所以你要把空格给截取出来。列之间是通过TAB键分割的。 我在一开始使用了C的库函数strtok这个函...
  • wanghaobo920
  • wanghaobo920
  • 2012年10月20日 22:06
  • 14606

C语言中常用的字符串操作(子串分割、替换、去前后空格、递归实现字符串反转)

在C语言中,并没有像java中对字符串操作的封装好的函数,在C语言中,都需要自己根据C语言函数库来实现常用的字符串操作 一、字符串的分割,根据子串进行分割 #include #include #in...
  • sinat_29957455
  • sinat_29957455
  • 2017年03月27日 22:38
  • 1093

C语言sscanf()函数:从字符串中读取指定格式的数据&&C语言strtok()函数:字符串分割

头文件:#include sscanf()函数用于从字符串中读取指定格式的数据,其原型如下:     int sscanf (char *str, char * format [, argu...
  • riba2534
  • riba2534
  • 2017年04月19日 20:26
  • 1494

c语言中几个读取键盘输入带空格字符串的方法

------Java培训、Android培训、iOS培训、.Net培训、期待与您交流! -------
  • oChenBin1
  • oChenBin1
  • 2015年04月06日 10:51
  • 2778
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:读取文件行并分割行中字符串:C/C++以及python实现
举报原因:
原因补充:

(最多只允许输入30个字)