- 博客(10)
- 收藏
- 关注
转载 一个完整的大作业
目的:爬取4399小游戏网站相关数据,分析受欢迎的小游戏目的网址:http://www.4399.com/gamehw.htm手段:利用谷歌浏览器查看源代码并加以分析,用python语言爬取自己需要的数据下图为4399小游戏首页,我们发现首页有着各种栏目,信息杂乱,爬取此页的数据并不能达到此次目的,观察整个页面选取了“最新好玩游戏列表”的栏目,下面将对进入这个栏目的...
2017-10-24 16:04:00
141
转载 数据结构化与保存
1.结构化:单条新闻的详情字典:news一个列表页所有单条新闻汇总列表:newsls.append(news)所有列表页的所有新闻汇总列表:newstotal.extend(newsls)2.转换成pandas的数据结构DataFrame3.从DataFrame保存到excel4.从DataFrame保存到sqlite3数据库import requ...
2017-10-19 16:49:00
91
转载 爬取所有校园新闻
1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。2.获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。3.获取所有新闻列表页的网址,调用上述函数。4.完成所有校园新闻的爬取工作。import requestsfrom bs4 import BeautifulSoupimport re#获取一个新闻列表页的所...
2017-10-12 14:26:00
107
转载 用requests库和BeautifulSoup4库爬取新闻列表
用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源、详细内容。将其中的时间str转换成datetime类型。将取得详细内容的代码包装成函数。import requestsfrom bs4 import BeautifulSoupfrom datetime import datetimegzccurl =...
2017-09-28 09:16:00
183
转载 中文词频统计及词云制作
1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容? 在工作上一般用python操作什么,python的实际应用之类的,也可以虚拟一个项目来进行实践。2.中文分词下载一中文长篇小说,并转换成UTF-8编码。使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。**排除一些无意义词、合并同一词。**使用wordc...
2017-09-25 17:06:00
212
转载 组合数据类型练习,英文词频统计实例
1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。score=list('3231233212232313232')print('评分表:\n',score)score.append('1')print('\n增加一个同学的评分:\n',score)score.p...
2017-09-21 18:56:00
83
转载 字符串操作练习:星座、凯撒密码、99乘法表、词频统计预处理
实例:输出12个星座符号,以反斜线分隔。实例:恺撒密码的编码mw=input('请输入明文:')print('密文:',end='')a=ord('a')z=ord('z')for i in mw: if a<=ord(i)<z: print(chr(a+(ord(i)-a+3)%26),end='') e...
2017-09-18 15:55:00
82
转载 条件、循环、函数定义、字符串操作练习
1.对前面的代码进行优化,用for,while,if,def实现:(1).用循环画五角星import turtleturtle.begin_fill()for i in range(5): turtle.forward(100) turtle.right(144)turtle.end_fill() 运行效果:...
2017-09-14 18:17:00
45
转载 python练习
1.Hello World!print('Hello World!')运行结果:2.简单交互(交互式,文件式)教材P19(1)交互式(2)文件式name = input("输入姓名:")print("{}同学,学好python,前途无量!".format(name))print("{}大侠,学好python,大展拳脚!"....
2017-09-07 19:25:00
208
转载 大数据分析:博客园的发展
博客园创建于2004年1月,博客园诞生于江苏扬州这样一个IT非常落后的小城市,城市虽小,但是这里却有很多求知创新的人,博客园诞生的理由是如此简单。下图为百度指数的数据。根据搜素指数的图表我们可以看到博客园的发展一直持续上升,越来越多的人开始使用博客园。博客园的用户中成长出了一批又一批专家,在IT行业中大展身手!下图为搜索指数的地域分布。我们可以看到,位居龙...
2017-09-04 21:00:00
96
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人