![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python相关
国师的玄兵是什么
这个作者很懒,什么都没留下…
展开
-
scrapy爬虫selenium模拟无法登陆和爬取的问题
使用selenium模拟浏览器进行数据抓取无疑是当下最通用的数据采集方案,它通吃各种数据加载方式,能够绕过客户JS加密,绕过爬虫检测,绕过签名机制。它的应用,使得许多网站的反采集策略形同虚设。由于selenium不会在HTTP请求数据中留下指纹,因此无法被网站直接识别和拦截。但是selenium在运行的时候会暴露出一些预定义的Javascript变量(特征字符串),例如"window.naviga...原创 2019-01-16 11:28:33 · 1255 阅读 · 0 评论 -
初步认识numpy
如果有jupyter的话在jupyter实验可以看到每一步的效果便于理解Jupyter用法:在jupyter文件如note.ipynb所在的文件夹打开cmd命令行输入 jupyter notebookimport numpy as np两点间的距离:def len(p1,p2): x = np.square(p1[0] - p2[0]) y = np.squa...原创 2019-01-16 11:45:02 · 222 阅读 · 0 评论 -
初步认识pandas
pandas应用import pandas as pd选取等于某些值的行记录 用 ==df.loc[df[‘column_name’] == some_value]选取某列是否是某一类型的数值 用 isindf.loc[df[‘column_name’].isin(some_values)]多种条件的选取 用 &df.loc[(df[‘column’] == some...原创 2019-01-16 11:49:00 · 150 阅读 · 0 评论 -
实现简单的词云和柱状图展示及jiebafen分词和计数
词云results = ['python','java','python','flask','django','flask']result_dic = {}for item_str in results: if item_str not in result_dic: result_dic[item_str] = 1 else: result...原创 2019-01-16 13:11:36 · 424 阅读 · 0 评论