实习笔记:WS
HuWF
Null
展开
-
【第二周:07/01-07/05】Maxmind地理名乱码处理+Nginx搭建
一.2019/07/0101.jupyter notebook常用快捷键:https://blog.csdn.net/qq_38640439/article/details/81143836 https://www.cnblogs.com/sui776265233/p/9759303.html02.用于outputs的交付软件:nginx03.Web服务器:...原创 2019-08-13 11:34:11 · 358 阅读 · 0 评论 -
【第五周:07/22-07/26】Maxmind,cnc城市名匹配
一.2019/07/2201.上一阶段总结汇报: 上一阶段完成:①.分析了cnc、maxmind和qqLocList库三个文件的地理名信息,如下: 发现qq的LocList库虽然较为规范,但国家不全,因此可能需要重新找其他标准。 今天计划:①.尝试解决loclist库国家数不全问题,或者另找其他可行标准;②.寻找cnc、maxmind和某标准库的城市名匹配的思路及...原创 2019-08-13 11:35:15 · 516 阅读 · 0 评论 -
【第七周:08/05-08/09】city_name提取整合
一.2019/08/06(周二)01.Pycharm激活码生成网站:http://idea.lanyus.com/02.阶段总结:遇到问题:①.cnc提供的city_name有较多的缺失值(qita),且额外信息仅有ip段。因此唯一可行的思路是通过ip段来补全city_name缺失值。然而尝试在其他ip库上通过ip段查找city_name的时候,发现大部分ip库也同样缺失该信息,因此理论上...原创 2019-08-13 11:35:47 · 474 阅读 · 0 评论 -
【第八周:08/12-08/16】CNC和MaxMind城市名FSN乱码匹配
一.2019/08/1201.聚类思路:通过文本聚类算法,借助maxmind的经纬度对其city_name进行聚类分析,得到上级城市名:https://blog.csdn.net/Changyuyang/article/details/81631521https://blog.csdn.net/sunshine_duoy/article/details/53044365二.2019/0...原创 2019-08-13 11:36:04 · 339 阅读 · 0 评论 -
【第九周:08/19-08/23】Output整合
一.2019/08/1901.Python变量命名规范:https://www.cnblogs.com/zhangyafei/p/10429426.html02.ACM程序文档:http://ishare.iask.sina.com.cn/f/19eh2vHDjAt.html二.2019/08/2001.初步output的程序文档:城市名FSN生成与处理模块说明文档Pro...原创 2019-08-20 16:19:28 · 532 阅读 · 1 评论 -
【第十周】实习核心内容--面试要点总结
01.什么是CDN(Content Delivery Network,内容分发网络): 空间换时间的策略:https://www.jianshu.com/p/6cfb0b65b556) CDN的基本原理:广泛采用各种缓存服务器,将这些缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直...原创 2019-08-21 17:57:15 · 289 阅读 · 0 评论