Python “今日新闻”一个小程序，拿走就能用！_pytthon新闻播报小程序

本文链接：https://blog.csdn.net/2401_84140580/article/details/138933634

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

date = dt.today()
if style!=1: return f'{date.month}月{date.day}日'
return f'{date.year}-{date.month:02}-{date.day:02}'

def SinaNews(style=1):
url1 = ‘http://news.***.com.cn/’
if style1: url1 += ‘world’
elif style2: url1 += ‘china’
else: url1=‘https://mil.news.sina.com.cn/’
text = get(url1)
text.encoding=‘uft-8’
soup = bs(text.text,‘html.parser’)
aTags = soup.find_all(“a”)
return [(t.text,t[‘href’]) for t in aTags if Today() in str(t)]


#### 爬取标题



> 
> >>> for i,news in enumerate(SinaNews(1)):  
>      print(f'No{i+1}:',news[0])
> 
> 
>       
>  No1: 外媒：\*\*\*\*\*  
>  No2: 日媒：\*\*\*\*\*\*  
>  ......
> 
> 
> .......
> 
> 
> 内容已马赛克！！！  
>  >>> 
> 
> 
> 


首次做爬虫，为了方便下手找一个不用破解网页的某新闻网站，下载网页就能直接取得内容。其中的国际、国内和军事新闻三个网页作内容源，requests.get下载网页后，分析所得html文本，所有<a href=...>标记带日期刚好所需要的。


#### 爬取正文


然后再根据url下载正文网页，分析可知id=‘article’的<div>层就是正文所在位置，.get\_text()是取得文本的关键函数，然后适当做一些格式处理：

def NewsDownload(url):
html = get(url)
html.encoding=‘uft-8’
soup = bs(html.text,‘html.parser’)
text = soup.find(‘div’,id=‘article’).get_text().strip()
text = text.replace(‘点击进入专题：’,‘相关专题：’)
text = text.replace(’　　‘,’\n　　‘)
while ‘\n\n\n’ in text:
text = text.replace(’\n\n\n’,‘\n\n’)
return text

url = ‘https:///w/2021-09-29/doc-iktzqtyt8811588.shtml’
NewsDownload(url)
'原标题：************************************************’


### 界面代码


使用内置的图形界面库 tkinter 控件 Text 、Listbox、Scrollbar、Button。设置基本属性、放置位置、绑定命令，然后调试到程序完工！


源代码 News.pyw ：其中涉及的网站名称已马赛克！

from requests import get
from bs4 import BeautifulSoup as bs
from datetime import datetime as dt
from os import path
import tkinter as tk

def Today(style=1):
date = dt.today()
if style!=1: return f’{date.month}月{date.day}日’
return f’{date.year}-{date.month:02}-{date.day:02}’

def SinaNews(style=1):
url1 = ‘http://news..com.cn/’
if style1: url1 += ‘world’
elif style2: url1 += ‘china’
else: url1='https://mil..com.cn/’
text = get(url1)
text.encoding=‘uft-8’
soup = bs(text.text,‘html.parser’)
aTags = soup.find_all(“a”)
return [(t.text,t[‘href’]) for t in aTags if Today() in str(t)]

def NewsList(i):
global news
news = SinaNews(i)
tList.delete(0,tk.END)
for idx,item in enumerate(news):
tList.insert(tk.END,f’{idx+1:03} {item[0]}')
tText.config(state=tk.NORMAL)
tText.delete(0.0,tk.END)
tText.config(state=tk.DISABLED)
NewsShow(0)

def NewsList1(): NewsList(1)
def NewsList2(): NewsList(2)
def NewsList3(): NewsList(3)

def NewsShow(idx):
if idx!=0:
idx = tList.curselection()[0]
title,url = news[idx][0],news[idx][1]
html = get(url)
html.encoding=‘uft-8’
soup = bs(html.text,‘html.parser’)
text = soup.find(‘div’,id=‘article’).get_text().strip()
text = text.replace(‘点击进入专题：’,‘相关专题：’)
text = text.replace(’　　‘,’\n　　‘)
while ‘\n\n\n’ in text:
text = text.replace(’\n\n\n’,‘\n\n’)
tText.config(state=tk.NORMAL)
tText.delete(0.0,tk.END)
tText.insert(tk.END, title+‘\n\n’+text)
tText.config(state=tk.DISABLED)

def InitWindow(self,W,H):
Y = self.winfo_screenheight()
winPosition = str(W)+‘x’+str(H)+‘+8+’+str(Y-H-100)
self.geometry(winPosition)
icoFile = ‘favicon.ico’
f = path.exists(icoFile)
if f: win.iconbitmap(icoFile)
self.resizable(False,False)
self.wm_attributes(‘-topmost’,True)
self.title(bTitle[0])
SetControl()
self.update()
self.mainloop()

def SetControl():
global tList,tText
tScroll = tk.Scrollbar(win, orient=tk.VERTICAL)
tScroll.place(x=450,y=320,height=300)
tList = tk.Listbox(win,selectmode=tk.BROWSE,yscrollcommand=tScroll.set)
tScroll.config(command=tList.yview)
for idx,item in enumerate(news):
tList.insert(tk.END,f’{idx+1:03} {item[0]}')
tList.place(x=15,y=320,width=435,height=300)
tList.select_set(0)
tList.focus()
bW,bH = 70,35 #按钮的宽高
bX,bY = 95,270 #按钮的坐标
tBtn1 = tk.Button(win,text=bTitle[1],command=NewsList1)
tBtn1.place(x=bX,y=bY,width=bW,height=bH)
tBtn2=tk.Button(win,text=bTitle[2],command=NewsList2)
tBtn2.place(x=bX+100,y=bY,width=bW,height=bH)

（1）Python所有方向的学习路线（新版）

这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

最近我才对这些路线做了一下新的更新，知识体系更全面了。

在这里插入图片描述