数据处理
PilviMannis
这个作者很懒,什么都没留下…
展开
-
【python】已知起始点经纬度坐标、偏转角、距离,求终点经纬度坐标
import mathdef get_end_lonlat(lon, lat, angle, distance): R = 6371.393 # 地球半径 AB = distance # 行进距离 (单位:km) ang = math.radians(angle) # 弧度转角度 lat0 = math.radians(lat) nAB = AB / R ab = R * math.sin(nAB / 2) * 2 ac = a.原创 2021-09-22 19:24:12 · 1429 阅读 · 3 评论 -
python -m spacy download en 提示服务器连接一直失败安装不上
解决方案:我在这一步的时候卡住了,运行不了转到https://github.com/explosion/spacy-models/tags,这个Git项目中包含了很多spacy的model,可自行选择一个对应的en和de,这里我选的是de_core_news_sm-2.2.5.tar.gz和en_core_web_sm-2.2.5.tar.gz,这里尽量让这两个包的版本一致,不然运行的时候对spacy的版本要求不一致会报错。/// 执行下面指令对en和de进行安装pip install de_cor原创 2020-12-30 18:03:06 · 2256 阅读 · 0 评论 -
离散数据作为神经网络的输入,我们该如何进行处理
离散数据归一化处理离散型数据处理方式one-hot(原因总结如下):使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间中的某个点;将离散的特征通过one-hot编码映射到欧式空间,是因为在回归、聚类、分类等机器学习算法中,特征之间距离的计算或者相似度的计算是非常重要的,而我们常用的距离或者相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。将离散型特征使用one-hot编码,确实会让特征之间的距离计算更加合理。比如,有一个离散型特征,原创 2020-12-21 11:06:16 · 4774 阅读 · 3 评论