Python Tkinter 练习1--抓取特定网页资料

Python Tkinter 练习1--抓取特定网页资料

Author: Xiaohong
运行环境: OS: Win7 64位 专业版Pack1、Python: 3.7

功能: 

  1. 抓取特定网页,把特定段落,导入到txt 文件
  2. 再通过txt 文件导入到Excel 及 sqlite db 中

自定义库 tk_eastmoney.py 脚本如下:

# -*- coding: UTF-8 -*-
#Time: 2020/02/16
#Author: Xiaohong
#运行环境: OS: Win7 64位 专业版Pack1
#  Python: 3.7
#  phantomjs: phantomjs-2.1.1-windows
#  db: Python 自带的Sqlite
from selenium import webdriver
import time
from selenium.webdriver.common.keys import Keys
import xlwt
import tkinter as tk
import tkinter.messagebox
import sqlite3
import re

#把网址中的id为:dt_1 导入到 同目录下的 data.txt 中
def imtxt(website):
    is_continue = tkinter.messagebox.askyesno('Welcome! ', '是否要生成txt文件? 你输入的是:'+website)
    if is_continue:
        #以下,需要先在电脑上安装 phantomjs
        driver = webdriver.PhantomJS(executable_path=r"E:\python_test\BS4\phantomjs-2.1.1-windows\bin\phantomjs.exe")
        # driver.get('http://data.eastmoney.com/cjsj/gpkhsj.html')
        driver.get(website)
        time.sleep(5)
        data = driver.find_element_by_xpath('//*[@id="dt_1"]').text
        try:
            fo = open("data.txt","w")
        except IOError:
            print("文件打开失败!!!")
        fo.write(data)
        fo.close()
    else:
        tkinter.messagebox.showinfo(title='取消操作', message='您取消了导入操作')

#设立函数,来取得当前时间,作为文件名的一部分,以免文件名重复
def get_sysdate():
    now = time.strftime("%Y-%m-%d-%H-%M-%S", time.localtime(time.time()))
    # print(now)
    return now

#把同目录下的 data.txt 中 导入到 Excel 中
def toxls():
    filename 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值