- 博客(8)
- 收藏
- 关注
原创 爬虫遇到的问题汇总
1. 注意xpath很重要, # x_path的位置十分重要,根目录一定要写对 xpath_urls = '//div[@class="fff-product-detail"]/a' # 获取所有的目录下的源码 urls_pre = browser.find_elements_by_xpath(xpath_urls)2. 网址的重定向问题,注意爬取的页面很可能是重定向过的网址,需要去除重定向def get_real_url(fake_url,try_count =
2020-08-20 15:17:25 1236
原创 pytorch基础用法
1.# 把x0和x1的数据合在一起,声明是什么类型的数据集x = torch.cat((x0, x1), 0).type(torch.FloatTensor) # shape (200, 2) FloatTensor = 32-bit floatingy = torch.cat((y0, y1), ).type(torch.LongTensor) # shape (200,) LongTensor = 64-bit integer2.对于回归问题常用的损失函数有:均方误差(MS..
2020-08-20 11:15:57 246
原创 VBA问题总结
1.设置单元格格式 .Columns("B:B").NumberFormat = "yyyy-mm-dd" .Columns("C:D").NumberFormat = "hh:mm"2.VBA时间列和日期列合并,设置String类型的变量 temp = .Cells(i, 2) + .Cells(i, 3) ' .Cells(i, 3).ClearContents ...
2019-03-01 15:34:34 845
原创 python处理数据20条:2
1.关于重复项的处理taskId = data_merge['taskid']#取出所有的重复项duplicated_data= data_merge[taskId.isin(taskId[taskId.duplicated()])]#去除所有的taskid相同的重复项,剩余的唯一值与等会取过成本中位数的重复项数据合并unique_data = data_drop.drop_dupl...
2019-03-01 15:34:20 270
原创 excel相关
1、时间的处理在excel中先用text将所有时间转换成为文本格式=G2+TIME(0,30,0),向后加30分钟2、关于处理startTime和endTime由于startTime为23:50时,执行完毕任务可能会跨天,所以需要将endTime<startTime的数据筛选出来,并把其日期加一天。=A1+1 //日期加一天直接加1 OK,跨月的也会自...
2019-03-01 15:34:03 102
原创 java的相关问题总结
1.根据字符串所在的位置截取相应的字符:比如取2018/5/5,只取到5日:String theDayOfDate = eachLine.getPlanSendDate().substring(eachLine.getPlanSendDate().lastIndexOf("/")+1,eachLine.getPlanSendDate().toString()2.生成csv文件sta...
2019-01-25 15:07:21 155 1
原创 python数据清洗常用:工作总结1
每份工作总结写20条1. 对一列数据进行操作a['create_tm'].map(lambda x:x[:10])2.将一列数据变为时间格式:pd.to_datetime(a['create_tm'].map(lambda x:x[:10]))3.将一列数据的索引重置 从1开始索引a.index = range(1,len(a)+1)a.index = ...
2018-12-19 17:17:45 641
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人