爬虫--上市公司名称业绩及相关新闻

博主分享了使用request-html库爬取网易财经上市公司名称和业绩,以及东方财富网的上市公司相关新闻内容的经验,对比了request-html相对于requests库的优势。
摘要由CSDN通过智能技术生成

刚发现request-html库,比requests好用,
之前用requests爬过新浪新闻标题,
这次用request-html爬取网易财经上市公司名称业绩,和东方财富网的上市公司新闻内容
在这里插入图片描述
crawler_entity.py

from requests_html import HTMLSession
import csv
import os
import random

USER_AGENTS= [
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_3) AppleWebKit/535.20 (KHTML, like Gecko) Chrome/19.0.1036.7 Safari/535.20",
    #网上找的几个#
    ......
    ]
session = HTMLSession()
#urlroot = 'https://car.autohome.com.cn/'
url_base = 'http://quotes.money.163.com/data/caibao/yjgl_ALL.html?reportdate=20181231&sort=publishdate&order=desc&page='

def get_companyentity():
    current_dir = os.path.abspath('.')
    print(current_dir)
    file_name = os.path.join(current_dir, "entity.csv")
    print(file_name)
    with open(file_name, 'wt', newline='')  as csvfile:
        writer = csv.writer(csvfile)
        header = ['序号','代码'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值