python-数据分析
文章平均质量分 90
白墨石
生物信息学在读博士,主要研究生信软件开发及数据库搭建,涉及机器学习,组学流程自动化,序列分析。
联系方式在左栏,欢迎学习交流,咨询提问 ^.^
展开
-
Pandas 修改单列,多列,Dataframe 数据类型方法汇总
文章目录1.修改单列的数据类型2.修改指定多列的数据类型3.创建dataframe时,修改数据类型4.读取时,修改数据类型5.自动1.修改单列的数据类型import pandas as pdimport numpy as npdf = pd.read_csv('test.csv')df['column_name'] = df['column_name'].astype(np.str)...原创 2020-04-17 11:01:14 · 27404 阅读 · 0 评论 -
使用Python Pandas处理亿级数据
在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:硬件环境CPU:3.5 GHz Intel Core i7内存:转载 2017-10-23 15:55:20 · 2409 阅读 · 0 评论 -
Pandas 速查表 (2023版)
数据读写数据创建数据查看数据操作数据提取数据筛选数据统计操作数据表结构数据表合并数据读写 代码 作用 df = pd.DataFrame(pd.read_csv(‘input.csv’,header=1)) 读取csv df = pd.DataFrame(pd.read_excel(‘input.xlsx’)) 读取xlsx...原创 2018-04-06 16:52:25 · 3155 阅读 · 0 评论