达观杯文本处理1
一、获取数据
1.数据下载
数据下载地址:
http://www.dcjingsai.com/common/cmpt/“达观杯”文本智能处理挑战赛_赛体与数据.html
下载后会得到一个压缩包,训练集和测试集数据均在里面.
二.处理过程
1.读取
直接读取内存爆炸了,本文只选取了其中的一些复制到excel中,。
import numpy as np
import pandas as pd
df = pd.read_excel("tr.xlsx&
1.数据下载
数据下载地址:
http://www.dcjingsai.com/common/cmpt/“达观杯”文本智能处理挑战赛_赛体与数据.html
下载后会得到一个压缩包,训练集和测试集数据均在里面.
直接读取内存爆炸了,本文只选取了其中的一些复制到excel中,。
import numpy as np
import pandas as pd
df = pd.read_excel("tr.xlsx&