pandas 数据载入
将表格型数据读取为DataFrame对象是pandas的重要特性
read_csv
从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符
read_table
从文件、URL或文件型对象读取分隔好的数据,制表符 ‘\t’ 是默认分隔符
指定分隔符
pd.read_table('hello/ex1.csv',sep=',')
当字段以不同数量的空格分开时,可以向read_table传入一个正则表达式作为分隔符,如sep=’\s+’ 表示匹配任意多个空白字符,包括空格、制表符、换页符等等。
附:
正则表达式:描述一种字符串匹配的模式,用于检查字符串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
(节选自菜鸟教程)
非打印字符
\cx 匹配由x指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 ‘c