python
天山卷卷卷
大河之水天上来
展开
-
Python爬取360手机助手评论——以百度地图为例
想做竞品分析,打算先从应用市场爬一些应用的用户用户评论作为素材;这次爬取的是360手机助手网站,结尾附爬取完的百度地图和高德地图的用户评论文件~网页链接:http://zhushou.360.cn/detail/index/soft_id/7655?recrefer=SE_D_%E7%99%BE%E5%BA%A6%E5%9C%B0%E5%9B%BE#nogo以中评为例 ,打开f12开发者模式,...原创 2019-10-15 15:19:13 · 1045 阅读 · 1 评论 -
python3中的map()、reduce()、zip()与zip(*)函数
map、reduce、zip三个函数可以用在不同需求下的需要迭代或循环进行的功能中。1、map()语法:map(function, iterable, ...)map函数的参数是由function和一个或多个序列组成,map运行机制就是对序列部分使用function进行处理并返回结果。python2与python3中的map函数略有不同,python2返回的是列表,python3返回的是...原创 2019-03-22 00:53:25 · 927 阅读 · 0 评论 -
python实现高德POI点(GCJ-02)火星坐标批量转换为WGS84
最近整理项目的时候发现了之前用过的火星坐标转WGS84坐标的python代码,记录一下。火星坐标GCJ-02(G-Guojia国家,C-Cehui测绘,J-Ju局),又被称为火星坐标系,是一种基于WGS-84制定的大地测量系统,由中国国测局制定。此坐标系所采用的混淆算法会在经纬度中加入随机的偏移。国家规定,中国大陆所有公开地理数据都需要至少用GCJ-02进行加密,也就是说我们从国内公司的产品中...原创 2019-03-17 17:41:52 · 8743 阅读 · 20 评论 -
python转换时间格式提取时间信息
最近处理数据时需要从csv的时间单元格中分别提取此日期的星期几、小时、分钟等信息,整理了两种思路,记录一下。使用time库中的time.strptime使用pandas库中的pd.to_datetime1、使用time库中的time.strptimestrptime可以根据指定的格式把一个时间字符串解析为时间元组。语法:time.strptime(string[, format])...原创 2019-03-21 10:18:00 · 6742 阅读 · 0 评论 -
Python中copy()、deepcopy()与赋值的区别(浅复制、深复制)
转载自:https://blog.csdn.net/u011630575/article/details/78604226 copy()与deepcopy()之间的主要区别是python对数据的存储方式。首先直接上结论:—–深复制,即将被复制对象完...转载 2019-02-17 19:37:59 · 833 阅读 · 1 评论 -
pandas中df.iloc函数应用
pandas.df.iloc函数官方文档定义为“基于整数位置的索引,用于按位置进行选择。”(官方文档http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.iloc.html#pandas.DataFrame.iloc)啥意思呢,意思就是iloc函数只根据行列号对数据进行切片或选择,与loc函...原创 2019-02-17 11:34:53 · 22948 阅读 · 0 评论 -
Python中的eval()函数
eval()函数又称为评估函数,作用是去掉参数中最外层引号并执行剩余语句。划重点:只去掉最外层引号eval()的参数形式为字符串或字符串变量,在程序中可以将字符串形式的输入值转化为数字进行计算。更广泛的应用是将任意字符串形式的输入值转化为Python可处理的语句。eval函数的参数必须为字符串,否则将报错:TypeError: eval() arg 1 must be a string...原创 2019-01-27 11:42:17 · 20369 阅读 · 0 评论 -
pandas pd.cut()与pd.qcut()
1、pd.cut函数有7个参数,主要用于对数据从最大值到最小值进行等距划分 pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)参数:x : 输入待cut的一维数组bins : cut的段数,一般为整型,但也可以为序列向量。right :...原创 2019-01-21 20:34:31 · 15322 阅读 · 0 评论 -
numpy.random函数应用(持续更新)
1、numpy.random.randint默认包含low、high、size和dtype四个参数。numpy.random.randint(low,high,size,dtype)默认参数 high是None,如果只写参数low,那随机生成数的范围为就是[0,low)。默认size为1。df = np.random.randint(50,size=10)#生成[0,50)的长度为...原创 2019-01-15 22:12:31 · 151 阅读 · 0 评论