Linux 目录 / |- bin 系统可执行目录 |- boot 启动目录 |- dev 设备目录 /dev/null /dev/zero /dev/shm |- etc 配置 |- home 用户目录 |- lib 系统库 |- media 挂载设备 |- mnt (mount)
调度 线程调度时间 ────────────────────────────────────────────────────────────────────────>Thread A ──────────> ──────────> ──────────> 大量计算 │ ^ │
爬虫 爬虫爬虫的构成下载器:downloader解析器:parser调度器:dispatcher 线程池协程池怎样开始一个爬虫确定抓取目标页面分析流程规划存储规划页面解析css selectorxpathjsonregexp任务调度多线程多进程RPCQueue分布式爬虫常遇到的问题JS 页面 Phantomjs常规页面无需使用反爬虫策略 ip: 抓取代理 I
后端开发 (1) 后端开发HTTP (HyperText Transfer Protocol)Python 系常见 Web 框架 Django 大而全,内部耦合比较紧凑,插件丰富,适合快速开发Flask 精而简,便于二次开发和扩展开发,生态环境好,插件丰富Tornado 异步处理,性能优异Falcon 适合做 API 服务web.py 代码优秀,适合学习bottle 单文件框架点击一个链
Python 进阶 Python 进阶Python 的惯例和规范PEP8not xx in yy vs xx not in yya not is b vs a is not b下划线 _命名惯例 类名: 首字母大写函数名: 小写字母,下划线连接全局变量: 大写, 且在开头声明普通变量: 小写一个函数只做一件事情,并把这件事做好函数名必须有动词,最好是 do_something 的句式,或者 som
Python 常用库 Python 常用库内建函数abs hasattr reversedall id roundany isinstance setbin issubclass setattrdivmod iter
面试题收集 面试题收集https://www.codementor.io/sheena/essential-python-interview-questions-du107ozr6 http://codingpy.com/article/essential-python-interview-questions/https://www.toptal.com/python/interview-questions
Linux 企业对 Linux 的要求日常操作cd, ls, cp, mv, rm, mkdircp / mv / rm : -i 询问 -f 强制 -n 不覆盖pwd 显示当前完整路径ln -s [src_file] [dst_file]touch 没有则创建,有则忽略historybashrc 配置显示时间: export HISTTIMEFORMAT=”[%y-%m-%d_%T] “进程管理