命名实体识别（一）_Python3爬取新闻并将文本存入MySQL

最新推荐文章于 2024-05-15 08:39:48 发布

平虑草

最新推荐文章于 2024-05-15 08:39:48 发布

阅读量852

点赞数 3

分类专栏： web数据挖掘 python 文章标签：命名实体识别 MySQL python3 爬虫

本文链接：https://blog.csdn.net/weixin_43832703/article/details/93493254

版权

Python3爬取新闻并存入MySQL

项目内容：

1.爬取某新闻正文

2.将新闻正文存入Mysql

本文以两篇人民网新闻为例

一、爬取新闻正文

# -*- coding:utf-8 -*-
import lxml.html
import tushare as ts
from sphinx.util import requests
import pymysql
pymysql.install_as_MySQLdb()
import mysqldbda
from sqlalchemy import create_engine
def reptile(web,xpath1,xpath2):
    selector = lxml.html.fromstring(requests.get(web).content.decode('GBK'))
    site = selector.xpath(xpath1)
    selector_html = []
    for i in range(len

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

平虑草

关注关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
命名实体识别（一）_Python3爬取新闻并将文本存入MySQL

Python3爬取新闻并存入MySQLPython3爬取新闻并存入MySQL项目内容：1.爬取某新闻正文2.将新闻正文存入Mysql本文以两篇人民网新闻为例一、爬取新闻正文# -*- coding:utf-8 -*-import lxml.htmlimport tushare as tsfrom sphinx.util import requestsimport pymys...
复制链接

扫一扫