读入文件
f = open('labels.csv')
df_train = pd.read_csv(f)
pd.read_csv() 括号里是文件名而不是路径
f = open('xxx.csv',encoding='utf-8')
data = pd.read_csv(f)
生成器对象
<generator object bigrams at 0x000001D5B9FC3AC0>
函数返回的不是列表,而是一个“生成器对象”,原来生成器对象是一个可以产生数据,可迭代的一个对象。
生成器表达式:
>>> l = [n for n in range(10)]
>>> l
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
如果将[ ]改为(),l不是列表类型,而是一个“生成器表达式”:
>>> l= (n for n in range(10))
>>> l
<generator object <genexpr> at 0x000001D5B9FC3A50>
怎么查看生成器表达式的结果呢?有两种方式:
1
list(l)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
2
for n in l:
… print(n)
…
0
1
2
3