python-bobo老师数据分析
文章平均质量分 68
Lemon_guess
这个作者很懒,什么都没留下…
展开
-
clean
# 将list转化为dataframename_pd = pd.DataFrame(name)year_pd = pd.DataFrame(year)rate_pd = pd.DataFrame(rate)director_pd = pd.DataFrame(director)scriptwriter_pd = pd.DataFrame(scriptwriter)protagonist_pd = pd.DataFrame(protagonist)genre_pd = pd.DataFrame(原创 2021-07-23 12:58:34 · 92 阅读 · 0 评论 -
老男孩-数据分析 05 人口分析案例
需求:■导入文件,查看原始数据■将人口数据和各州简称数据进行合并■将合井的数据中重复的abbreviation列进行删除■查看存在缺失数据的列■找到有哪些state/region使得state的值为NaN, 进行去重操作■为找到的这些state/region的state项补. 上正确的值,从而去除掉state这- -列的所有NaN■合并各州面积数据areas■我们会发现area(sq.m)这-列有缺失数据, 找出是哪些行■去除含有缺失数据的行■找出2010年的全民人口数据■计算各州的人原创 2021-06-10 02:49:35 · 350 阅读 · 0 评论 -
老男孩-数据分析 04 基于pandas的数据清洗
一、数据清洗1.1有两种丢失的数据类型Nonenp.nan(NaN))NaN是可以参与运算的import numpy as npimport pandas as pdfrom pandas import DataFrame,Seriestype(None)Out[166]: NoneTypetype(np.nan)Out[168]: floatdf = DataFrame(data=np.random.randint(0,100,size=(7,5)))df.iloc[3原创 2021-06-10 01:23:07 · 184 阅读 · 1 评论 -
老男孩-数据分析03 DataFrame基础操作巩固-股票分析
需求:股票分析●使用tushare包获取某股票的历史行情数据。.●输出该股票所有收盘比开盘上涨3%以上的日期。●输出该股票所有开盘比前日收盘跌幅超过2%的日期。●假如我从2010年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易8卖出所有股票,到今天为止,我的收益如何?●tushare: 财经数据接口包,可以批量获取相关金融产品的历史数据pip install tushare金融分析基本面分析■宏观经济面分析:国家的财政政策、货币政策等■行业分析■公司分析:财务数据、业原创 2021-06-10 00:40:25 · 292 阅读 · 0 评论 -
老男孩 数据分析 02 pandas基础操作
为什么学习pandasnumpy已经可以帮助我们进行数值型数据的处理了,pandas还可以进行许多其他类型的数据处理(字符串等)。什么是pandas?1. 首先认识pandas中两个常用的类:Series和Dataframefrom pandas Series- 是一种类似与一维数组的对象,由两个部分组成:value:一组数据(ndarray类型)index:相关的数据索引标签Dataframe(重点)由列表或者numpy数组创建由字典创建...原创 2021-06-10 00:39:20 · 236 阅读 · 0 评论 -
老男孩 - 数据分析 01(Numpy)
什么是数据分析?1.是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律,使得数据的价值最大化。分析用户的消费行为—— 制定促销活动的方案——制定促销时间和力度——计算用户的活跃度——分析产品的回购力度分析广告点击率——决定投放时间——制定广告定向人群方案——决定相关平台的投放2.数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们做出判断,一边采取适当的行动保险公司从大量赔付申请数据中判断哪些行为为骗保的可能支付宝通过从大量的用户消费记录原创 2021-06-07 03:34:10 · 454 阅读 · 1 评论 -
老男孩-数据分析 06 pandas高级操作
Python:出现UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc9 in position 0: invalid continuation byte问题我在导入一个csv文件的时候出现了一个问题报错的内容是这样的:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc9 in position 0: invalid continuation byte内容显示读取的时候发现了我导入原创 2021-06-10 00:15:51 · 394 阅读 · 0 评论