前言
用Python自动化日常任务很容易。通过api和库的结合,您可以轻松地设置系统来抓取网站、发送电子邮件、管理数据和分析。
在本文中,我们将概述如何编写一个Python脚本,该脚本可以下载一组特定的公共数据,然后将其上传到电子邮件中,并将其发送给任何需要的人。
这将使您熟悉使用Python请求库和Gmail API。因此,如果您希望将来使用Python自动处理电子邮件,这是一个很好的学习起点。
用Python下载文件
对于第一步,我们将需要使用HTTP请求实际下载数据文件。
在本例中,我们将要下载的文件甚至在下面的链接中有一个简单的端点。因此,您不需要使用Selenium这样的库来尝试单击下载按钮。通常,如果有一个URL,那么使用链接下载就非常容易。
https://data.medicaid.gov/api/views/u72p-j37s/rows.json?accessType=DOWNLOAD
这个文件提供关于医疗补助和个人登记的信息。这对医疗保健提供者来说是有价值的,他们可以将其与内部数据联系起来,帮助更好地了解他们的市场。
为了下载它,我们将使用函数requests.get()。这将允许我们使用HTTP请求将数据拉到我们指定的URL。
例如,你可以看看下面的脚本:
# Part 1: Fetch the data. # Get the webpage, store it in a Response object and assign the text # About: https://requests.readthedocs.io/en/master/api/#requests.Response # This URL contains the .csv download of # 'https://catalog.