- 博客(7)
- 资源 (6)
- 收藏
- 关注
原创 python3-csv写入中文乱码问题
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入python3-csv写入中文乱码正确打开方式应该加上encoding=‘utf-8-sig’代码import csv
2020-10-24 20:29:54 563
原创 csv文件中某几行特别宽,格式刷刷完后会变成一样宽,但是保存后再打开还是无效——原因及解决方案
原因:这种情况可能的原因是:表格特别宽的那几行中有的单元格有换行符解决方案:使用excel替换功能替换掉换行符。excel中换行符要通过 "长按alt“+”小键盘数字1“+”小键盘数字0“三步来输入。替换为空,再格式刷一下即可解决此问题。...
2020-10-18 15:59:47 1413
原创 Python数据分析3——爬虫读入url和中断继续开始功能
爬虫执行过程中,难免会受网络出故障,电脑死机等一些不可控因素 的干扰,而一旦出现这种情况,代码就会报错或者中断,需要重新执行。这样一来,为了避免代码的重复执行,保障运行效率,就必须要给代码设置中断后重新开始的功能。中断继续开始的思路如下:前提:1.定义好爬虫函数(这个因具体网页而异)2.定义存储抓完的url的函数def saveFinished(url=None, path=None):...
2020-04-12 23:55:44 2321
原创 python数据分析2——爬虫的请求头(headers)和代理IP(proxies)设置
PROXIES = [ 'http://183.136.177.77:3128', 'http://54.229.233.101:80', ........... 'http://194.167.44.91:80']USER_AGENTS = [ "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535....
2020-04-12 00:19:48 3209
原创 Python数据分析1——正则表达式之 (.*?)匹配和 \ 转义
正则表达式条目众多、纷繁复杂,我在接触正则的时候就感觉有些摸不着头脑,甚至到现在为止也理得不是很清。每次想要去记一下表达式具体含义时,都会因为太多而不了了之,就想如果用到现查也是不错的选择。但是有两个正则是我每个爬虫任务都必用的,这两个万金油的正则表达就是**(.*?)和 \ **。在之前所做过的爬虫中我都用这个正则把想要的字给匹配出来,以至于我只会这一个爬虫的匹配字段方式,而没有去接触和了解其...
2020-04-11 00:42:54 697
原创 Python数据分析0——读入CSV数据和写出CSV数据
1.读入CSV的代码:with open (inpath,mode=‘r’, encoding=“utf-8-sig”) as infile:for line1 in infile.readlines():list1 = line1.split(’###’)list2 = list1[0:-1] + list1[-1].split()#这样得到的列表不带有最后回车项,与能够直接写入的列表...
2020-04-10 00:47:31 370
原创 csv数据根据某一列内容删除重复行
*csv数据根据某一列内容删除重复行利用Python爬虫获取了csv格式的数据,但数据每一行有重复内容,需要把含有重复项的整行删除掉,按照某列的内容删除重复行(按照整行同理),代码如下(按照自己的路径修改代码中路径即可):import csvif __name__ == '__main__': inpath='C:/Users/Administrator/Desktop/爬虫汇总...
2019-10-11 19:20:45 5459
计算统计学课程作业禁忌搜索解决背包问题matlab代码
2020-11-16
计算统计学课程作业30种随机数发生器(组合随机数发生器)matlab代码
2020-11-16
高级算法设计实验4:快速排序
2020-11-16
高级算法设计实验3:近似算法
2020-11-16
高级算法设计实验2:搜索算法python实现
2020-11-16
高级算法设计实验1分治算法:求解凸包问题
2020-11-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人