实时主流信息搜集 Real_time_information_set v1.0.3.6

实时主流信息搜集 Real_time_information_set

Real_time_information_set ——————github源码

为解决实时主流信息获取的需求,采用python技术,设计了实时主流信息程序,获得了满意的结果,程序经测试,符合预期需求,为构建一种可以灵活扩展的应用程序提供解决思路或借鉴。
https://github.com/lhl1/Real_time_information_set

3. img

*程序设计:*

img



cmd = 'your command'

res = subprocess.call(cmd, shell=True, stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE)

用于隐藏cmd命令窗口

打包时需要pyinstaller --onefile --icon=favicon.ico  test.py -w

普通的pyinstaller -F -i favicon.ico test.py

无法隐藏cmd命令窗口

window = tk.Tk()

创建gui

window.title("LHL's Information")

window.iconbitmap('favicon.ico')

window.geometry("1500x1000")

设置窗口名称,图标,大小

img

这两个为全局变量

Flag表示现在的线程 

img

用于控制临界资源,不抢占text输出窗口

delay_time

为time.sleep的时间,单位秒

定义定义线程刷新时间间隔
img
*Flag一定要用全局,不然无法起到控制临界资源的作用*
HTTP是“Hypertext Transfer Protocol”的所写,整个万维网都在使用这种协议,几乎你在浏览器里看到的大部分内容都是通过

http协议来传输的.

HTTP Headers是HTTP请求和相应的核心,它承载了关于客户端浏览器,请求页面,服务器等相关的信息。

'user-agent':

User-Agent会告诉网站服务器,访问者是通过什么工具来请求的,如果是爬虫请求,一般会拒绝,如果是用户浏览器,就会应答。

'cookie':

Cookie是保存在客户端的纯文本文件。比如txt文件。所谓的客户端就是我们自己的本地电脑。当我们使用自己的电脑通

过浏览器进行访问网页的时候,服务器就会生成一个证书并返回给我的浏览器并写入我们的本地电脑。

t = tk.Text(window, width=3840, height=2160, font=('Consolas', 15))   

创建一个文本框输出输出

img

t.delete(1.0, 'end') 为删除之前显示的内容

t.insert('end', "          hd_ai" + '\n' + '\n')

插入标题

JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式

url = 'https://www.hd.ai/Torrents.tableList'
	source = requests.get(url=url, headers=headers).json()

请求json数据

img

#### card_list = source['data']['items']

#### 定位到每个词条

Card_list中包含所有的词条,是一个集合

img

之后遍历card_list下的'small_descr'和'details' 得到标题和网址

之后通过t.insert 输出到tk.Text

除了上面json按层级展开,还有xpath寻找和正则表达式寻找

img

titles = tree.xpath('//*[@id="sanRoot"]/main/div[2]/div/div[2]/div')

为匹配到所用的div词条

img

for i in titles:

再进行逐个遍历输出词条

img```

再输出想要的数据到tk.text后



操作菜单',    

img

Youtube 的结构比较复杂,需要用到正则匹配

img


youtube_json = re.compile('responseContext".*?"serviceTrackingParams(.*?)function serverContract()', re.S)

(.*?)为需要的内容  .*?为可以变动的内容  其他为固定内容
因为内容太多,匹配需要很长时间,先进行一次筛选,只留下包含信息的内容

再进行第二次筛选
youtube_title= = re.compile(',"title":{"runs":.{"text":"(.*?)"}.,.*?publishedTimeText":{"simpleText":"(.*?)"},.*?accessibilityData":{"label":"(.*?)"}},.*?viewCountText":{"simpleText":"(.*?)"},"navigationEndpoint.*?webCommandMetadata.*?url":"(.*?)".*?ownerText.*?text":"(.*?)","navigationEndpoint.*?操作菜单',re.S)     

 

names = re.findall(youtube_title, json_get)

用youtube_title规则对 json_get 进行筛选

得到 6 条有用信息

img


再进行输出,得到结果

img

threadName, delay 是用于多线程的名字和延迟,但我的延迟不由此决定,而是由time.sleep(delay_time)决定

Delay_time是一个全局变量,方便全局控制,无需逐个调试

img

每个功能都用一个线程调用

 

flag = 'hd_ai'

  while flag == 'hd_ai':

上面的flag用于控制临界资源,就是Tk.text

如果多个线程调用text,则他们抢占text,无法看清内容

如果不用多线程的话,就会出现

如果网页请求超时或无法请求或网页格式改变,程序就会卡死,无响应
*程序********运行界面*
img

img

img

img

结论与感想

大数据技术用了多年时间进行演化,才从一种看起来很炫酷的新技术变成了企业在生产经营中实际部署的服务。其中,数据采集产品迎来了广阔的市场前景,无论国内外,市面上都出现了许多技术不一、良莠不齐的采集软件。一款简单易用的网页信息抓取软件,能够抓取网页文字、图表、超链接等多种网页元素。同样可通过简单可视化流程进行采集,服务于任何对数据有采集需求的人群。

一个简单,简洁的信息搜集软件对我生活的改变是巨大的,不用花大量的时间在互联网上寻找新闻与信息,只需要简单的浏览,便可以知道绝大多数想了解的信息,从而提高效率,获得更多的信息。

软件往往无需过度的修饰,斯是陋室,惟实用,为先,简单往往意味着高效。过度的修饰往往破坏获取信息的效率。互联网的信息过于繁杂,往往只需要获取头部的信息,和一些深度分析文章即可。

要主动打破信息茧房,不要让算法左右了我们的人生。
### 回答1: 《VxWorks 7 实时网络开发指南》是一份详细介绍VxWorks 7实时网络开发的文档。VxWorks 7是一款实时操作系统,广泛应用于嵌入式系统中。该文档对于开发人员来说非常重要,因为它提供了详细的指导和实例,帮助开发人员了解VxWorks 7的实时网络编程和调试技术。 该文档首先介绍了VxWorks 7的基本概念和体系结构。它详细解释了实时网络的基本原理和特点,并介绍了VxWorks 7的网络协议栈和网络驱动程序。然后,文档介绍了如何在VxWorks 7中创建和配置网络连接,包括IP地址、子网掩码、网关等。此外,文档还介绍了如何使用VxWorks 7的网络API进行数据传输和通信。 在文档的后面部分,还介绍了VxWorks 7网络调试和故障排除的技术和工具。开发人员可以通过使用VxWorks 7的调试接口和命令,了解网络连接的状态和性能,并解决网络故障和性能问题。 总之,《VxWorks 7 实时网络开发指南》是一份非常有用的文档,帮助开发人员理解和应用VxWorks 7的实时网络开发技术。对于需要在VxWorks 7上进行实时网络开发的开发人员来说,这是一本必备的参考书。无论是初学者还是有经验的开发人员,都可以从中获得宝贵的知识和经验。 ### 回答2: vxworks_7_real_time_network.pdf 是一本关于VxWorks 7 实时网络的文件。VxWorks 7 是一个实时操作系统,广泛应用于嵌入式系统和网络设备中。这本文件描述了VxWorks 7 在实时网络领域的特点和功能。 该文件首先介绍了实时网络的基本概念和要求。实时网络是指具有快速、可靠、实时的数据传输能力的网络。实时网络要求能够保证数据的传输具有严格的时限和连续性,以满足实时系统的需求。 随后,文件详细介绍了VxWorks 7 的实时网络特性。VxWorks 7 提供了一套完整的实时网络协议栈,支持多种实时协议,如TCP/IP、UDP、以太网等。同时,VxWorks 7 还提供了灵活的网络配置和管理功能,可以满足不同应用场景的需求。 此外,文件还详细介绍了VxWorks 7 实时网络的性能优化和调优方法。通过合理配置网络参数、优化网络资源分配和调度策略,可以提高实时网络的性能和效率。 最后,文件还提供了一些在实践中的案例和实例,展示了VxWorks 7 实时网络在不同应用领域的应用场景和成功案例。这些案例包括工业控制、无线通信、智能交通等领域。 综上所述,vxworks_7_real_time_network.pdf 是一本介绍VxWorks 7 实时网络特点和功能的文件,它介绍了VxWorks 7 实时网络的基本概念、特性、性能优化方法,并提供了实践案例,对于研究和应用实时网络的人士具有重要的参考价值。 ### 回答3: vxworks_7_real_time_network.pdf是一份有关于VxWorks 7实时网络的文档。VxWorks是一种实时操作系统,主要用于嵌入式系统和网络设备。这个文档提供了关于VxWorks 7在实时网络方面的详细信息。 文档中首先介绍了VxWorks 7的概述和架构。它提供了一个完整的实时操作系统环境,能够满足各种应用的实时需求。然后,文档详细讲解了VxWorks 7实时网络的功能和特性。VxWorks 7提供了丰富的网络协议栈,支持各种通信协议,如TCP/IP、UDP、HTTP等。它还提供了高性能的网络传输机制,可实现实时数据的快速传输。 除此之外,这个文档还介绍了VxWorks 7的网络管理和安全功能。VxWorks 7提供了强大的网络管理工具,可实现对网络配置、监控、故障诊断等的管理。它还支持各种网络安全机制,如加密、认证等,保护系统免受网络攻击。 文档的最后部分讨论了VxWorks 7实时网络的应用场景。它可以广泛应用于工业自动化、智能交通、物联网等领域。无论是对实时性要求高的控制系统,还是需要快速、可靠通信的应用,VxWorks 7都能满足需求。 总之,vxworks_7_real_time_network.pdf是一份关于VxWorks 7实时网络的详细文档,介绍了其架构、功能、特性、管理和安全,以及应用场景。通过阅读这个文档,用户可以了解VxWorks 7在实时网络方面的能力和应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值