自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(10)
  • 收藏
  • 关注

转载 一个完整的大作业

目的:爬取4399小游戏网站相关数据,分析受欢迎的小游戏目的网址:http://www.4399.com/gamehw.htm手段:利用谷歌浏览器查看源代码并加以分析,用python语言爬取自己需要的数据下图为4399小游戏首页,我们发现首页有着各种栏目,信息杂乱,爬取此页的数据并不能达到此次目的,观察整个页面选取了“最新好玩游戏列表”的栏目,下面将对进入这个栏目的...

2017-10-24 16:04:00 141

转载 数据结构化与保存

1.结构化:单条新闻的详情字典:news一个列表页所有单条新闻汇总列表:newsls.append(news)所有列表页的所有新闻汇总列表:newstotal.extend(newsls)2.转换成pandas的数据结构DataFrame3.从DataFrame保存到excel4.从DataFrame保存到sqlite3数据库import requ...

2017-10-19 16:49:00 91

转载 爬取所有校园新闻

1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。2.获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。3.获取所有新闻列表页的网址,调用上述函数。4.完成所有校园新闻的爬取工作。import requestsfrom bs4 import BeautifulSoupimport re#获取一个新闻列表页的所...

2017-10-12 14:26:00 107

转载 用requests库和BeautifulSoup4库爬取新闻列表

用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源、详细内容。将其中的时间str转换成datetime类型。将取得详细内容的代码包装成函数。import requestsfrom bs4 import BeautifulSoupfrom datetime import datetimegzccurl =...

2017-09-28 09:16:00 183

转载 中文词频统计及词云制作

1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容? 在工作上一般用python操作什么,python的实际应用之类的,也可以虚拟一个项目来进行实践。2.中文分词下载一中文长篇小说,并转换成UTF-8编码。使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。**排除一些无意义词、合并同一词。**使用wordc...

2017-09-25 17:06:00 212

转载 组合数据类型练习,英文词频统计实例

1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。score=list('3231233212232313232')print('评分表:\n',score)score.append('1')print('\n增加一个同学的评分:\n',score)score.p...

2017-09-21 18:56:00 83

转载 字符串操作练习:星座、凯撒密码、99乘法表、词频统计预处理

实例:输出12个星座符号,以反斜线分隔。实例:恺撒密码的编码mw=input('请输入明文:')print('密文:',end='')a=ord('a')z=ord('z')for i in mw: if a<=ord(i)<z: print(chr(a+(ord(i)-a+3)%26),end='') e...

2017-09-18 15:55:00 82

转载 条件、循环、函数定义、字符串操作练习

1.对前面的代码进行优化,用for,while,if,def实现:(1).用循环画五角星import turtleturtle.begin_fill()for i in range(5): turtle.forward(100) turtle.right(144)turtle.end_fill()  运行效果:...

2017-09-14 18:17:00 45

转载 python练习

1.Hello World!print('Hello World!')运行结果:2.简单交互(交互式,文件式)教材P19(1)交互式(2)文件式name = input("输入姓名:")print("{}同学,学好python,前途无量!".format(name))print("{}大侠,学好python,大展拳脚!"....

2017-09-07 19:25:00 208

转载 大数据分析:博客园的发展

博客园创建于2004年1月,博客园诞生于江苏扬州这样一个IT非常落后的小城市,城市虽小,但是这里却有很多求知创新的人,博客园诞生的理由是如此简单。下图为百度指数的数据。根据搜素指数的图表我们可以看到博客园的发展一直持续上升,越来越多的人开始使用博客园。博客园的用户中成长出了一批又一批专家,在IT行业中大展身手!下图为搜索指数的地域分布。我们可以看到,位居龙...

2017-09-04 21:00:00 96

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除