- 博客(2)
- 收藏
- 关注
原创 对文章的分类和聚类
以之前抓取的“科技”和“娱乐”文章为例 ‘articls.csv’中的内容如图: 分类 import jieba import joblib from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer import numpy as np from sklearn.metrics im...
2018-03-09 17:07:54 1753 1
原创 今日头条“科技”,“娱乐”类文章的抓取
import multiprocessing from selenium import webdriver import time from bs4 import BeautifulSoup import requests #将结果写入'articles.csv' fw=open('articles.csv','a',encoding='utf8') #请求头 headers={ 'U...
2018-03-09 16:52:54 1577
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人