- 博客(6)
- 收藏
- 关注
原创 爬虫——把jason格式用pandas化成dataframe
豆瓣电影分类排行榜 - 动画片url='https://movie.douban.com/j/chart/top_list?type=25&interval_id=100%3A90&action=&start=0&limit=20'headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.469
2022-02-17 14:06:12
446
原创 爬虫1——(爬虫3days课程)
一 理论分类:通用爬虫和聚焦爬虫通用爬虫——主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。尽可能的把互联网上的所有的网页下载下来,放到本地服务器里形成备份,再对这些网页做相关处理(提取关键字、去掉广告),最后提供一个用户检索接口。聚焦爬虫——是"面向特定主题需求"的一种网络爬虫程序,它与通用搜索引擎爬虫的区别在于:聚焦爬虫在实施网页抓取时会对内容进行处理筛选,尽量保证只抓取与需求相关的网页信息。二 URL的搜索策略✓ 基于IP地址搜索策略——先赋予爬虫一
2022-02-13 15:16:57
517
原创 Python基础2——Jupyter基本操作(公众号)
一 快捷键按esc进入命令模式→H看菜单按enter进入编辑模式【Shift+Enter】:运行开始后单元格前方的中括号里会出现【*】标记,同时在下方会产生一个新的空代码单元格【Alt+Enter】:运行当前单元格并在下方插入新的单元格。【Ctrl+Enter】:运行当前单元格并进入命令模式,此时不会有新的单元格产生。二 中止代码运行在命令模式下连续按下两次【i】键来实现/也可以点击工具栏中的正方形按钮进行停止/选择菜单栏之中的【Kernal】对内核进行中断、重启等操作..
2022-02-13 14:51:19
793
原创 Python基础2——open函数
#设置路径,调出数据import osos.getcwd() os.chdir("D:\李雅倩个人\硕士\研一上课\数据分析\教材——Python数据科学实践-赠送资源\Python数据科学实践-赠送资源\code-finall\cluebearpython-master\原始数据和图片\原始数据")os.getcwd() #读写文件txt=open('lyq.txt','w') #读文件,w,没有该文件则创建新txt文件,或者‘lyq.xlsx’文件txt.write('..
2021-12-17 20:58:16
396
原创 Python基础1——导入文件数据
1、设置路径import os os.getcwd() ##查看当前工作目录os.chdir("D:\李雅倩个人\硕士\研一上课\数据分析\教材——Python数据科学实践-赠送资源\Python数据科学实践-赠送资源\code-finall\cluebearpython-master\原始数据和图片\原始数据") ##设置存放路径os.getcwd() ##重新查看新路径输出:2、导入pandas模块coupon=
2021-12-17 19:49:21
689
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人