Benzmjs-CSDN博客

原创 pandas去掉行索引输出到Excel

之前一直被一个问题困扰，就是pandas的dataframe类型输出到Excel后，存在行索引，因为行索引对数据分析的结果不会产生影响所以一直没有去解决，今天偶然看到了解决方法，特地记录下来，帮助有缘之人。文章目录1.问题展示源数据读取csv并输出的代码pandas输出后2.问题解决官方文档对于to_excel()输出时不添加行索引的描述代码实现效果展示1.问题展示我们以泰坦尼克号的数据作为测试数据，读取后输出到Excel表格中，我们会发现每行前被添加了索引号源数据读取csv并输出的代码#.

2021-05-10 16:32:54 19975 1

原创关于django项目中settings.py中的BASE_DIR的分析

首先祝愿天下程序员写的程序永无bug，身体健康，万寿无疆datetime:2019-11-11 0:30authore:Benzmjs说明 whatfile.py 路径: base_dir 路径:1.首先在桌面创建一个名为base_dir的django项目当前我们项目的绝对路径应该是C:\Users\mjs\Desktop\base_dir2.打开配置文件我们可以看到B...

2019-11-11 01:28:50 2850

原创爬虫:使用xpath排除不想要的标签

但愿天下所有的程序员需求都会写，入坑秒跳出，程序无bug昨天用scrapy爬取了一个关于邮政编码的网站，这时候遇到了一个问题，用xpath排除不想要的标签话不多说先上图在网上查了很多资料，好像大部分都是说，让我们全部提取出来之后，然后再切片，或其他把不想要的剔除，但是我就想一次性把自己想要的提取到而不做额外的处理，最后，终于找到如果只想要2-10的tr不要1和11的tr，xpath应...

2019-10-20 09:56:09 3696 2

原创关于使用scrapy框架下载图片掉的坑

最近，公司有个需求，要爬取百度资讯里的文章，且把文章的图片下载到本地，在此期间入坑首先看SaveImagePipeline管道里代码#下载文章内容图片管道class SaveImagePipeline(ImagesPipeline): def get_media_requests(self, item, info): for every_content_image_...

2019-10-10 14:48:32 1120

原创 Python爬虫之地址自动补全

我们在做爬虫项目的时候很经常遇到，提取的地址不全而需要我们拼接补全:例如:正真的地址是:http://tieba.baidu.com/mo/q-----,m?kw=123456我们爬取到的地址是m?kw=78910通常我的做法(使用字符串的拼接)spider_url="m?kw=78910"url = "http://tieba.baidu.com/mo/q-----,"+spider...

2019-10-01 00:04:44 3295

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 pandas去掉行索引输出到Excel

原创 关于django项目中settings.py中的BASE_DIR的分析

原创 爬虫:使用xpath排除不想要的标签

原创 关于使用scrapy框架下载图片掉的坑

原创 Python爬虫之地址自动补全

空空如也

空空如也

原创关于django项目中settings.py中的BASE_DIR的分析

原创爬虫:使用xpath排除不想要的标签

原创关于使用scrapy框架下载图片掉的坑