python
Roar Boil
这个作者很懒,什么都没留下…
展开
-
python爬虫练习1:计算评分平均值
练习要求:抽取某本书的前50条短评内容并计算评分的平均值。提示:有的评论中并不包含评分。代码:# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""import requestsfrom bs4 import BeautifulSoupimport reimport timeto...原创 2019-08-25 19:12:39 · 3341 阅读 · 1 评论 -
BeautifulSoup简单Python爬取
数据抓取利用request库import requestsr = requests.get("https://movie.douban.com/subject/3541415/comments")文本解析利用BeautifulSoupfrom bs4 import BeautifulSoupsoup = BeautifulSoup(r.text, 'lxml')pattern =...原创 2019-08-22 15:10:54 · 143 阅读 · 0 评论 -
正则表达式简单python爬取
python中正则表达式的一些基本点例如要在一篇文档中寻找字符串he,则可以使用正则表达式he,它可以匹配出字符串he,如果忽略大小写的话还可以匹配出He、HE这样的字符串,这是最简单的正则表达式。但这种方式除了匹配出单独的he外还会匹配例如“hello”中的he。如果只想找出字符串he,可以使用元字符“\b”,它匹配单词的开始或结尾,即单词边界,因此可用“\bhe\b”匹配字符串he。再例如正...原创 2019-08-22 17:09:26 · 335 阅读 · 0 评论 -
python爬虫练习2:取道指成分股数据
练习要求:在“http://money.cnn.com/data/dow30/”上抓取道指成分股数据并将30家公司的代码、公司名称和最近一次成交价放到一个列表中输出。代码:# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""import requestsimport rer = r...原创 2019-08-26 16:18:10 · 2622 阅读 · 0 评论 -
简单平台用户信息管理系统
要求:用字典创建一个平台的用户信息(包含用户名和密码)管理系统,新用户可以用与现有系统帐号不冲突的用户名创建帐号,已存在的老用户则可以用用户名和密码登陆重返系统。实现代码:# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""lib = {"admin":"123456"}def ne...原创 2019-08-28 16:51:07 · 870 阅读 · 0 评论 -
DataFrame小练习
练习要求:已知有一个列表中存放了一组音乐数据:music_data = [(“the rolling stones”,“Satisfaction”),(“Beatles”,“Let It Be”),(“Guns N’ Roses”,“Don’t Cry”),(“Metallica”,“Nothing Else Matters”)]请根据这组数据创建一个如下的DataFrame: ...原创 2019-08-29 11:16:49 · 806 阅读 · 0 评论