Python
文章平均质量分 85
陈沧夜
人工智能领域创作者,华为云云享专家,百度飞桨技术专家
展开
-
使用 lasio 处理 .las 文件
.las 文件的数据格式比较奇特,如果将其看成 .txt 的数据,在使用 python 的 numpy, pandas 模块进行处理的时候就比较繁琐。原创 2022-10-17 16:26:12 · 1772 阅读 · 0 评论 -
Python调试工具——ipdb
Python调试工具——ipdb 的使用原创 2022-08-27 21:28:59 · 1502 阅读 · 0 评论 -
hands-on-data-analysis 第三单元 模型搭建和评估
hands-on-data-analysis 第三单元 模型搭建和评估原创 2022-06-23 23:31:52 · 634 阅读 · 0 评论 -
hands-on-data-analysis 第二单元 第四节数据可视化
1.2.基本的绘图示例原创 2022-06-20 19:16:48 · 507 阅读 · 0 评论 -
hands-on-data-analysis 第二单元 2,3节
万事开头记得导入基本的库:2.1.数据合并——concat横向合并官方文档:pandas.concat — pandas 1.4.2 documentation (pydata.org)对,两张表,如果横向合并为一张表(就是列与列拼接在一起)::得到:就好比,把带有小明的学号的表和带有小明成绩的表合在一起。官方文档:pandas.concat — pandas 1.4.2 documentation (pydata.org)将train-left-down和train-right-down横向合并为原创 2022-06-18 23:55:17 · 460 阅读 · 0 评论 -
hands-on-data-analysis 第二单元 - 数据清洗及特征处理
数值列读取数据后,空缺值的NaN为浮点型,最好用判断是否是NaN。可以筛选出缺失的值原创 2022-06-16 23:28:01 · 488 阅读 · 0 评论 -
np.nan == np.nan问题
今天在学习动手学数据分析的课程的时候,细心的队友发现了一个问题。对于数值型数据,pandas使用浮点值NAN(Not a Number)来表示缺失值,我们称NaN为容易检测到的标识值但是在运行以下代码时候,会发现......原创 2022-06-16 16:36:28 · 2308 阅读 · 0 评论 -
Hands-on data analysis 第一章
在进行后续步骤之前都需要载入模块:数据的载入,针对不同的文件有不同的载入方法:一般对于文件有:其他类型的文件,可以参考的官方文档:IO tools (text, CSV, HDF5, …) — pandas 1.4.2 documentation (pydata.org)对于不同的文件格式,可以参考上面的表格将列名重新定义为了中文格式将作为索引列表示第一行为列名可以用来查看数据的基本信息:1.4.只观察前几行数据或者末尾几行数据观察前十行观察末尾十五行,记住其返回的是True或者False,而不是原创 2022-06-15 00:20:41 · 619 阅读 · 0 评论 -
【pandas】Error tokenizing data. C error: Expected 6 fields in line 3, saw 9
【pandas】Error tokenizing data. C error: Expected 6 fields in line 3, saw 9文章目录【pandas】Error tokenizing data. C error: Expected 6 fields in line 3, saw 9起因查阅博客查阅官方文档起因今天又是编写代码的一天,在使用pandas的read_csv读取文件时候,程序运行突然出现了错误Traceback (most recent call last): F原创 2021-12-24 23:16:04 · 8427 阅读 · 3 评论 -
Pyenv 命令简述
Pyenv 命令简述文章目录Pyenv 命令简述Pyenv的安装这里我们推荐使用快速安装普通安装环境配置升级PyenvPyenv基本命令`pyenv commands``pyenv local``pyenv local` (advanced)`pyenv global``pyenv global` (advanced)`pyenv shell``pyenv shell` (advanced)`pyenv install``pyenv uninstall``pyenv version``pyenv vers原创 2020-06-21 12:06:26 · 948 阅读 · 0 评论 -
Python Matplotlib简要使用
Python Matplotlib简要使用文章目录Python Matplotlib简要使用主要含义js库推荐matplotlib的三层结构折线图绘制x,y刻度中文解决下载SimHei字体安装字体删除`matplotlib`缓存修改配置文件添加网格显示标题显示图例多个绘图区散点图柱状图直方图饼图主要含义mat --> matrix 矩阵plot --> 画图lib --> library 库例如:matlab 矩阵实验室js库推荐D3echartsmatplot原创 2020-05-08 20:24:47 · 891 阅读 · 1 评论 -
ubuntu20.04编译安装python3.7.7
ubuntu20.04编译安装python3.7.7ubuntu20.04的默认python版本是3.8.2,但是百度的飞桨需要的版本最高是3.7,于是我们需要新编译一个python3.7的版本。我们挑选的python3.7的版本是python3.7.7,链接如下:https://www.python.org/downloads/release/python-377/我们下载源码文件类型,...原创 2020-04-25 21:38:58 · 8586 阅读 · 5 评论 -
百度飞桨学习——七日打卡作业(三)选手数据分析
百度飞桨学习——七日打卡作业(三)选手数据分析文章目录百度飞桨学习——七日打卡作业(三)选手数据分析任务描述绘制选手区域分布柱状图普通方法绘制使用pandas进行数据处理体重饼图绘制普通方法处理使用pandas进行数据处理任务描述基于第二天实践使用Python来爬去百度百科中《青春有你2》所有参赛选手的信息,进行数据可视化分析。# 下载中文字体!wget https://mydueros...原创 2020-04-24 23:50:14 · 892 阅读 · 1 评论 -
百度飞桨学习——七日打卡作业(二)选手信息爬取
百度飞桨学习——七日打卡作业(二)《青春有你2》选手信息爬取文章目录百度飞桨学习——七日打卡作业(二)《青春有你2》选手信息爬取上网的全过程普通用户爬虫程序爬虫的过程使用的模块爬取百度百科中《青春有你2》中所有参赛选手信息,返回页面数据对爬取的页面数据进行解析,并保存为JSON文件爬取每个选手的百度百科图片,并进行保存打印爬取的所有图片的路径输出上网的全过程普通用户打开浏览器往目标站点发送...原创 2020-04-24 22:39:51 · 844 阅读 · 1 评论 -
pip3 报错:pip is being invoked by an old script wrapper.
本文目录开始分析问题的建议General Advice问题的调试Debugging the Issue问题的解决Fixing the Issue这个问题的原因是不正确的安装。pip的升级部分有的文章属于 CSDN 博主的误导,在这点上我也吃了亏,特别写这一篇文章提醒大家。碰到问题多搜索,不要听信一家之言。要不然很容易把自己的工作进度搞崩。这类问题的issue在github上,链接地址:http...原创 2020-03-16 18:55:23 · 26124 阅读 · 19 评论