数据处理
blues_phone
本是无一物,何处惹尘埃
展开
-
现成的python电商网站爬虫:可翻页爬取动态加载网站 + 静态网站
前言:大大小小的电商网站爬了不少。结论就是分两种类型:第一:requests 直接获取第二:网页动态加载,requests获取失败直接分享代码吧1.先导入需要的库和chromedriver的地址(爬动态加载的网页需要,若是requests可直接获取的网站可忽略)import time,re,pandas as pd,os,requestsfrom selenium import webdriverfrom bs4 import BeautifulSoupCHROME_DRI原创 2021-04-26 11:47:48 · 870 阅读 · 2 评论 -
excel数据预处理
数据预处理pandas对表格的操作也是基于xlwt,但是pandas读取数据要比xlrt更强大。xlrt 读取西班牙语的时候,会转成数组,pandas不会1.将数据二 值化将表格中某列只有两个结果,用1和0去替代2.单独修改一列为不同的值这里是修改 product_id 这一列数据,更新数据为它自身的某一部门import pandas as pd,osfrom pa...原创 2019-05-03 14:30:57 · 4226 阅读 · 0 评论