一.2019/08/12
01.聚类思路:通过文本聚类算法,借助maxmind的经纬度对其city_name进行聚类分析,得到上级城市名:https://blog.csdn.net/Changyuyang/article/details/81631521
https://blog.csdn.net/sunshine_duoy/article/details/53044365
二.2019/08/13
01.SettingwithCopyWarning解决:https://www.jianshu.com/p/72274ccb647a
02.pandas sort_values用法:https://blog.csdn.net/wendaomudong_l2d4/article/details/80648633
fsn.sort_values(axis=0,by="FSN",kind='quicksort',inplace=True)#排序
03.在线编辑Markdown的编辑器:http://mahua.jser.me/
04.可视化Markdown编辑器(冷熊):http://cv.ftqq.com/#
三.2019/08/14
01.超大csv文件快速加载软件:https://blog.csdn.net/feiren127/article/details/81876065
02.解决IPy模块中IP段转换时出现ValueError: ("IP('1.40.3.0/19') has invalid prefix length (19)报错:
IPY.IP('127.0.0.1/24',make_net=1)
主要是make_net默认为0,就是标准的iP最后一位是16,32,这种才行,设置为1,就可以自己定义了。
https://zhidao.baidu.com/question/918698143971378899.html
03.Python @property装饰器作用:https://www.cnblogs.com/coder2012/p/4433703.html
04.使用html在github上搭建个人静态主页:https://blog.csdn.net/hohaizx/article/details/85066248
05.使用github+jekyll搭建高级个人网站:https://www.jianshu.com/p/9f71e260925d
06.jekyll主题官网:http://jekyllthemes.org/
四.2019/08/15
01.pycharm安装并配置autopep8模块,使代码自动调整为pep8风格:https://www.cnblogs.com/xiao-apple36/p/9242069.html
02.python PEB8编码规范:https://blog.csdn.net/ratsniper/article/details/78954852
03.python私有变量和私有方法的命名规范:https://www.cnblogs.com/lijunjiang2015/p/7802410.html
1、 _xx 以单下划线开头的表示的是protected类型的变量。即保护类型只能允许其本身与子类进行访问。若内部变量标示,如: 当使用“from M import”时,不会将以一个下划线开头的对象引入 。
2、 __xx 双下划线的表示的是私有类型的变量。只能允许这个类本身进行访问了,连子类也不可以用于命名一个类属性(类变量),调用时名字被改变(在类FooBar内部,__boo变成_FooBar__boo,如self._FooBar__boo)
3、 __xx__定义的是特列方法。用户控制的命名空间内的变量或是属性,如init , __import__或是file 。只有当文档有说明时使用,不要自己定义这类变量。 (就是说这些是python内部定义的变量名)
04. 用Python实现不同数据源的对象匹配实验记录:https://segmentfault.com/a/1190000006931575
现有两份针对同一主题的数据,但是在人物的属性名称及格式上有所不同,需要对两份数据进行匹配来确定是同一个人。
(遇到的问题都比较经典!可以借鉴)
五.2019/08/16
01.神器!:unihandecode,可直接将拉丁文、希腊文、俄文等不规范字母、字符串转换为标准英文字母:
https://stackoverflow.com/questions/1382998/latin-1-to-ascii
https://segmentfault.com/a/1190000006931575
import unihandecode
ch['FSN_std']=ch['FSN'].apply(lambda x: unihandecode.unidecode(x))
02.ACM程序设计文档说明:
03.pandas中字符串的替换与全部替换:https://www.jianshu.com/p/2557a805211f
for i in "()/'`!- _":
fsn_latin['FSN_std']=fsn_latin['FSN_std'].str.replace(i, '')