自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 爬虫——把jason格式用pandas化成dataframe

豆瓣电影分类排行榜 - 动画片 url='https://movie.douban.com/j/chart/top_list?type=25&interval_id=100%3A90&action=&start=0&limit=20' headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.469

2022-02-17 14:06:12 437

原创 爬虫1——(爬虫3days课程)

一 理论 分类: 通用爬虫和聚焦爬虫 通用爬虫——主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜 像备份。尽可能的把互联网上的所有的网页下载下来,放到本地服务器里形成备份,再对这些网页做相关处理(提取关键字、去掉广告),最后提供一个用户检索接口。 聚焦爬虫——是"面向特定主题需求"的一种网络爬虫程序,它与通用搜索引擎爬虫的区别在于:聚焦爬虫在实施网页抓取时会对内容进行处理筛选,尽量保证只抓取与需求相关的网页信息。 二 URL的搜索策略 ✓ 基于IP地址搜索策略—— 先赋予爬虫一

2022-02-13 15:16:57 508

原创 Python基础2——Jupyter基本操作(公众号)

一 快捷键 按esc进入命令模式→H看菜单 按enter进入编辑模式 【Shift+Enter】:运行开始后单元格前方的中括号里会出现【*】标记,同时在下方会产生一个新的空代码单元格 【Alt+Enter】:运行当前单元格并在下方插入新的单元格。 【Ctrl+Enter】:运行当前单元格并进入命令模式,此时不会有新的单元格产生。 二 中止代码运行 在命令模式下连续按下两次【i】键来实现/也可以点击工具栏中的正方形按钮进行停止/ 选择菜单栏之中的【Kernal】对内核进行中断、重启等操作 ..

2022-02-13 14:51:19 781

原创 Python基础1——读取数据(公众号数据科学实践)

Python基础1——读取数据(公众号数据科学实践)

2022-02-13 14:49:08 444

原创 Python基础2——open函数

#设置路径,调出数据 import os os.getcwd() os.chdir("D:\李雅倩个人\硕士\研一上课\数据分析\教材——Python数据科学实践-赠送资源\Python数据科学实践-赠送资源\code-finall\cluebearpython-master\原始数据和图片\原始数据") os.getcwd() #读写文件 txt=open('lyq.txt','w') #读文件,w,没有该文件则创建新txt文件,或者‘lyq.xlsx’文件 txt.write('..

2021-12-17 20:58:16 384

原创 Python基础1——导入文件数据

1、设置路径 import os os.getcwd() ##查看当前工作目录 os.chdir("D:\李雅倩个人\硕士\研一上课\数据分析\教材——Python数据科学实践-赠送资源\Python数据科学实践-赠送资源\code-finall\cluebearpython-master\原始数据和图片\原始数据") ##设置存放路径 os.getcwd() ##重新查看新路径 输出: 2、导入pandas模块 coupon=

2021-12-17 19:49:21 680

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除