Python 编程基础
斵冰且行
Given enough eyeballs, all bugs are shallow.
足够多的眼睛,就可以让问题浮现。
展开
-
【Pandas基础教程】第26讲 统计分析实例:网站访问日志
目录读取数据、清理、格式化统计爬虫访问比例,输出饼图/柱状图统计状态码访问比例,输出饼图统计按小时、按天的PV/UV流量趋势,输出折线图原创 2020-12-30 15:41:19 · 670 阅读 · 0 评论 -
【Pandas基础教程】Seaborn数据可视化
目录1. 项目简介2. 外观主题3. 应用实例1. 项目简介Seaborn是基于Matplotlib的可视化类库,提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。它在Matplotlib基础上进行了更高级的API封装,使得绘图更加容易。同时,它还修改了默认的Matplotlib配色方案和绘图样式,即使不使用Seaborn API,也能够通过导入Seaborn,提高图表的美观度。安装:conda install seaborn;导入:import seaborn as sns。原创 2020-12-30 14:47:38 · 808 阅读 · 0 评论 -
【Pandas基础教程】Matplotlib数据可视化
目录1. 项目简介2. 应用实例2.1 折线图2.2 直方图2.4 饼图1. 项目简介Matplotlib是一个用于生成高质量图表(通常是二维)的交互式可视化类库,支持在Python环境下进行Matlab风格的绘图,同时支持将图表导出为常用的图形格式(PDF、SVG、JPG、PNG、BMP、GIF等)。该项目由John Hunter于2002年发起,经过与IPython社区的合作简化了在IPython/Jupyter中的交互式体验。作为数据可视化工具,Matplotlib略显底层,提供的图表较为基本,原创 2020-12-30 10:58:10 · 585 阅读 · 0 评论 -
【Pandas基础教程】第25讲 机器学习实例:泰坦尼克存活率预测
目录1. 问题分析2. 特征工程2.1 原始特征2.2 加工特征3. 算法选择3.1 线性回归3.2 逻辑回归3.3 随机森林3.4 梯度提升1. 问题分析监督学习中的分类问题,借助年龄、性别、费用等特征,预测乘客能否存活。2. 特征工程2.1 原始特征PassengerId,乘客编号,几乎没有影响;Survived,能否生存,目标列;Pclass,船舱等级,高级別客舱生存率可能高;Name,姓名,几乎没有影响;Sex,性别,影响体力体质、道德准则等;Age,年龄,影响体力体质、道德准原创 2020-12-28 16:18:25 · 183 阅读 · 0 评论 -
【Pandas基础教程】第08讲 SettingWithCopyWarning报警
目录1. 原因分析2. 处理思路3. 解决方案1. 原因分析SettingWithCopyWarning报警是链式操作的不确定性导致的,详见 https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy。链式操作是依序执行的,即先执行步骤一,再在中间结果的基础上执行步骤二,依次类推。前驱步骤的执行结果不一定符合后继步骤的输入条件,导致链式操作中间环节不一定成功。原创 2020-12-24 15:04:18 · 244 阅读 · 0 评论 -
【Pandas基础教程】第02讲 Pandas读取数据
目录1. 读取纯文本文件2. 读取Excel文件3. 读取MySQL数据库4. 数据库魔法命令1. 读取纯文本文件pd.read_csv() 用于读取csv、tsv、txt等纯文本文件,csv以逗号分隔,tsv以制表符分隔,txt的分隔符任意。pd.read_csv( filepath_or_buffer: FilePathOrBuffer, # 文件路径 sep=",", # 分隔符 header="infer",原创 2020-12-24 09:56:17 · 1145 阅读 · 0 评论 -
【Pandas基础教程】第08讲 Pandas的SettingWithCopyWarning报警
<iframe src="https://nbviewer.jupyter.org/github/moonspiritacm/pandas-learning/blob/master/%E7%AC%AC08%E8%AE%B2%20Pandas%E7%9A%84SettingWithCopyWarning%E6%8A%A5%E8%AD%A6.ipynb" width="100%" height="1000"></iframe>原创 2020-12-18 16:48:08 · 122 阅读 · 1 评论 -
【Pandas 基础教程】第08讲 Pandas 的 SettingWithCopyWarning 报警
目录原创 2020-12-18 14:19:23 · 98 阅读 · 0 评论 -
Python 序列详解(一)总论
Python 序列(Sequence)是指按特定顺序依次排列的一组数据,它们可以占用一块连续的内存空间,也可以分散到多块内存中。Python 序列包括字符串(string)、列表(list)、元组(tuple)、字典(dict)和集合(set)。列表和元组用于顺序存储数据,所有元素占用一块连续的内存空间,每个元素都有自己的索引,可以通过索引直接访问特定元素。它们的区别在于:列表是可以修改的,而元组是不可修改的。字典和集合用于无序存储数据,元素占用不同的内存空间,字典元素以键值对的形式原创 2020-10-09 17:41:37 · 358 阅读 · 0 评论 -
魔法命令
目录1. %quickref 显示 IPython 快速参考卡2. %magic 显示所有可用魔法命令的详细文档3. %debug 从最后发生报错的底部进入交互式调试器4. %hist 打印命令输入/输出历史5. %pdb 在发生异常后自动进入调试器6. %paste 执行剪贴板中的 Python 代码7. %cpaste 打开一个特殊的提示符,手工粘贴待执行的 Python 代码8. %reset 删除命名空间中的全部变量/名称9. %page object 分页显示一个对象10. %time state原创 2020-09-29 17:31:19 · 1538 阅读 · 2 评论 -
内省
IPython/Jupyter 提供能够快速浏览变量/方法概要信息的内省机制,一般格式为 `变量/方法名?`。原创 2020-09-29 15:57:18 · 103 阅读 · 0 评论 -
Tab 自动补全
IPython/Jupyter 提供不亚于集成开发环境的自动补全功能,支持命名空间、属性方法、函数参数和文件路径等的搜索补全。原创 2020-09-29 15:21:56 · 873 阅读 · 0 评论