python 去除Excel中的重复行数据 导入pandasimport pandas as pd1.读取excel中的数据;frame = pd.DataFrame(pd.read_csv('excel的绝对路径.csv'’, 'Sheet1'))2.去除重复行后的数据;data = frame.drop_duplicates(subset=’’, keep='first', inplace=’’)drop_duplicates...
python 常用函数集合 1、常用函数 round() : 四舍五入 参数1:要处理的小数 参数2:可选,如果不加,就是不要小数,如果加,就是保留几位小数 abs() :绝对值函数 max() :列表、字符串,得到最大的元素 min() :列表、字符串,得到最小的元素 hex() : 给一个十进制,将其转化为十六进制 oct() :...
Python爬取表结构数据---pandas快速获取 例如:此形式的表数据,可用pandas获取首先获取tableimport requestsfrom lxml import etreeimport pandas as pdurl = 'http://dn4.gxzjt.gov.cn:1141/WebInfo/Enterprise/Enterprise_Detail.aspx?prjnum=434458...
python爬虫抖音 个人资料 仅供学习参考 切勿用于商业 本文仅供学习参考 切勿用于商业本次爬取使用fiddler+模拟器(下载抖音APP)+pycharm1. 下载最新版本的fiddler(自行百度下载),以及相关配置1.1.依次点击,菜单栏-Tools-Options-HTTPS,如图1红框打钩,HTTPS旁边Connections配置,如图2红框打钩1.2.再次点击HTTPS栏,点击Actions选择第二个…to ...
windows服务器下,mysql运行一段时间之后忽然无法连接,但是mysql服务启动正常... 出现这种情况以前都是重启服务器可以解决,但是治标不治本,一段时间之后仍然会出现此问题。此问题不是mysql应用程序的问题而是windows server system 的配置问题。因此需要修改windows server system的配置。具体办法为修改windows 注册表:有两个相关值,一是修改MaxUserPort(最大连接数);另一个是修改TcpTimedWaitD...
Python爬虫面试题 python是如何进行内存管理的?a、对象的引用计数机制python内部使用引用计数,来保持追踪内存中的对象,Python内部记录了对象有多少个引用,即引用计数,当对象被创建时就创建了一个引用计数,当对象不再需要时,这个对象的引用计数为0时,它被垃圾回收。b、垃圾回收例如当一个对象的引用计数归零时,它将被垃圾收集机制处理掉。c、内存池机制Python提供了对内存的...