先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新Python全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Python知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip1024c (备注Python)
正文
def get_pars(html_data):
selector = parsel.Selector(html_data)
return selector
- 保存内容 PDF格式
html_str = “”"
<!doctype html>
{article}
“”"
def save_article(article, title):
html_path = ‘重庆新闻\’ + title + ‘.html’
pdf_path = ‘重庆新闻pdf\’ + title + ‘.pdf’
html = html_str.format(article=article)
with open(html_path, mode=‘w’, encoding=‘utf-8’) as f:
f.write(html)
print(‘{}已下载完成’.format(title))
exe 文件存放的路径
config = pdfkit.configuration(wkhtmltopdf=‘C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe’)
把 html 通过 pdfkit 变成 pdf 文件
pdfkit.from_file(html_path, pdf_path, configuration=config)
- 保存csv文件
f = open(‘新闻.csv’, mode=‘a’, encoding=‘utf-8-sig’, newline=‘’)
csv_writer = csv.DictWriter(f, fieldnames=[‘标题’, ‘作者’, ‘日期’, ‘新闻详情页’])
csv_writer.writeheader()
- 保存图片
def save_img(img_urls):
for i in img_urls:
img_url = ‘http://news.cqu.edu.cn’ + i
img_content = get_html(img_url).content
img_name = img_url.split(‘/’)[-1]
with open(‘新闻图片\’ + img_name, mode=‘wb’) as f:
f.write(img_content)
- 主函数
def main(url):
html_data = get_html(url).text
selector = get_pars(html_data)
lis = selector.css(‘body > div:nth-child(4) > div > div.lists .title a::attr(href)’).getall()
for li in lis:
content_data = get_html(li).text
li_selector = get_pars(content_data)
title = li_selector.css(‘.dtitle::text’).get() # 新闻标题
article = li_selector.css(‘.acontent’).get() # 新闻内容
name_list = li_selector.css(‘.dinfoa a::text’).getall() # 作者
name = ‘|’.join(name_list)
date_list = li_selector.css(‘.ibox span::text’).getall()
date_str = ‘’.join(date_list) # 新闻日期
img_urls = li_selector.css(‘.acontent p img::attr(src)’).getall() # 获取新闻内图片
dit = {
‘标题’: title,
‘作者’: name,
‘日期’: date_str,
‘新闻详情页’: li,
}
csv_writer.writerow(dit)
save_article(article, title)
save_img(img_urls)
if name == ‘main’:
for page in range(1, 11):
url = ‘https://news.cqu.edu.cn/newsv2/news-127.html?&page={}’.format(page)
main_thread = threading.Thread(target=main, args=(url,))
main_thread.start()
- 文件PDF
- 详情页url
- 相关图片
图片可以按照标题后缀数字123命名,这个地方可以优化
- csv文件数据
import requests
import parsel
import pdfkit
import csv
import threading
f = open(‘新闻.csv’, mode=‘a’, encoding=‘utf-8-sig’, newline=‘’)
csv_writer = csv.DictWriter(f, fieldnames=[‘标题’, ‘作者’, ‘日期’, ‘新闻详情页’])
csv_writer.writeheader()
headers = {
‘user-agent’: ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36’
}
html_str = “”"
<!doctype html>
{article}
“”"
def get_html(html_url):
response = requests.get(url=html_url, headers=headers)
return response
def get_pars(html_data):
selector = parsel.Selector(html_data)
return selector
def save_article(article, title):
html_path = ‘重庆新闻\’ + title + ‘.html’
pdf_path = ‘重庆新闻pdf\’ + title + ‘.pdf’
html = html_str.format(article=article)
with open(html_path, mode=‘w’, encoding=‘utf-8’) as f:
f.write(html)
现在能在网上找到很多很多的学习资源,有免费的也有收费的,当我拿到1套比较全的学习资源之前,我并没着急去看第1节,我而是去审视这套资源是否值得学习,有时候也会去问一些学长的意见,如果可以之后,我会对这套学习资源做1个学习计划,我的学习计划主要包括规划图和学习进度表。
分享给大家这份我薅到的免费视频资料,质量还不错,大家可以跟着学习
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip1024c (备注python)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
跟着学习
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip1024c (备注python)
[外链图片转存中…(img-ycN60Uz0-1713175614919)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!