#python之find_all #coding:utf8 from bs4 import BeautifulSoup #指定要搜索的文档: html_doc=""" <li><a href="//www.w3cschool.cn/javascript/" title="Javascript教程">Javascript</a></li> <li><a href="//www.w3cschool.cn/jquery/" title="Jquery教程">Jquery</a></li> <li><a href="//www.w3cschool.cn/bootstrap/" title="Bootstrap教程">Bootstrap</a></li> <li><a href="//www.w3cschool.cn/php/" title="PHP教程">PHP</a></li> <li><a href="//www.w3cschool.cn/java/" title="Java教程">Java</a></li> <li><a href="//www.w3cschool.cn/python/" title="Python教程">Python</a></li> <li><a href="//www.w3cschool.cn/mysql/" title="MySQL教程">MySQL</a></li> <li><a href="//www.w3cschool.cn/sql/" title="SQL教程">SQL</a></li> <li><a href="//www.w3cschool.cn/json/" title="JSON教程">Json</a></li> <!--<li><a href="//www.w3cschool.cn/c/" title="C教程">C</a></li>--> """ # 传入文档 解析器 指定编码:UTF-8 soup=BeautifulSoup(html_doc,'html.parser',from_encoding='utf-8') print '获取所有的链接:' links=soup.find_all('a') for link in links: print link.name,link['href'],link.get_text() #输出是这样: """ 获取所有的链接: a //www.w3cschool.cn/javascript/ Javascript a //www.w3cschool.cn/jquery/ Jquery a //www.w3cschool.cn/bootstrap/ Bootstrap a //www.w3cschool.cn/php/ PHP a //www.w3cschool.cn/java/ Java a //www.w3cschool.cn/python/ Python a //www.w3cschool.cn/mysql/ MySQL a //www.w3cschool.cn/sql/ SQL a //www.w3cschool.cn/json/ Json """
python之find_all
最新推荐文章于 2023-05-25 03:26:51 发布