- 博客(6)
- 收藏
- 关注
原创 爬虫——把jason格式用pandas化成dataframe
豆瓣电影分类排行榜 - 动画片 url='https://movie.douban.com/j/chart/top_list?type=25&interval_id=100%3A90&action=&start=0&limit=20' headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.469
2022-02-17 14:06:12 437
原创 爬虫1——(爬虫3days课程)
一 理论 分类: 通用爬虫和聚焦爬虫 通用爬虫——主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜 像备份。尽可能的把互联网上的所有的网页下载下来,放到本地服务器里形成备份,再对这些网页做相关处理(提取关键字、去掉广告),最后提供一个用户检索接口。 聚焦爬虫——是"面向特定主题需求"的一种网络爬虫程序,它与通用搜索引擎爬虫的区别在于:聚焦爬虫在实施网页抓取时会对内容进行处理筛选,尽量保证只抓取与需求相关的网页信息。 二 URL的搜索策略 ✓ 基于IP地址搜索策略—— 先赋予爬虫一
2022-02-13 15:16:57 508
原创 Python基础2——Jupyter基本操作(公众号)
一 快捷键 按esc进入命令模式→H看菜单 按enter进入编辑模式 【Shift+Enter】:运行开始后单元格前方的中括号里会出现【*】标记,同时在下方会产生一个新的空代码单元格 【Alt+Enter】:运行当前单元格并在下方插入新的单元格。 【Ctrl+Enter】:运行当前单元格并进入命令模式,此时不会有新的单元格产生。 二 中止代码运行 在命令模式下连续按下两次【i】键来实现/也可以点击工具栏中的正方形按钮进行停止/ 选择菜单栏之中的【Kernal】对内核进行中断、重启等操作 ..
2022-02-13 14:51:19 781
原创 Python基础2——open函数
#设置路径,调出数据 import os os.getcwd() os.chdir("D:\李雅倩个人\硕士\研一上课\数据分析\教材——Python数据科学实践-赠送资源\Python数据科学实践-赠送资源\code-finall\cluebearpython-master\原始数据和图片\原始数据") os.getcwd() #读写文件 txt=open('lyq.txt','w') #读文件,w,没有该文件则创建新txt文件,或者‘lyq.xlsx’文件 txt.write('..
2021-12-17 20:58:16 384
原创 Python基础1——导入文件数据
1、设置路径 import os os.getcwd() ##查看当前工作目录 os.chdir("D:\李雅倩个人\硕士\研一上课\数据分析\教材——Python数据科学实践-赠送资源\Python数据科学实践-赠送资源\code-finall\cluebearpython-master\原始数据和图片\原始数据") ##设置存放路径 os.getcwd() ##重新查看新路径 输出: 2、导入pandas模块 coupon=
2021-12-17 19:49:21 680
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人