数据集:链接: https://pan.baidu.com/s/1V_O9fW8jUTwtpgeVb7cSmg 提取码: 7sjx
本项目使用了机器学习中较为流行的随机森林模型,构建一个真假新闻检测判别器。
二、数据集介绍
关于数据集
在预处理、特征提取和模型分类方面,Getting Real about Fake News似乎最有希望。 原因是所有其他的数据集都缺乏文章/声明文本产生和发布的来源。引述文章文本的来源对于检查新闻的可信度至关重要,并进一步帮助将数据标记为假的或不可信的。
特征信息:
- title
- text
- subject
- date
- class
三、导包
我们需要导入本项目所需要的所有库,例如绘图库、模型库、评估函数库等
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_wine
f