数据分析
Python学习中的进阶者
不断地学习才能完善自己
展开
-
机器学习算法:唐老师1.1决策树算法
树模型决策树:从根节点开始一步步走到叶子节点(决策)所有的数据最终都会落到叶子节点,既可以做分类也可以做回归树的组成根节点:第一个选择点非叶子节点与分支:中间过程叶子节点:最终的决策结果决策树的训练与测试训练阶段:从给定的训练集构造出来一棵树(从跟节点开始选择特征, 如何进行特征切分)测试阶段:根据构造出来的树模型从上到下去走一遍就好了一旦构造好了决策树,那么分类或者预测任务就很简单了,只需要走一遍 就可以了,那么难点就在于如何构造出来一颗树,这就没那么容易了,需 要考虑的问题还有很多的原创 2020-10-04 11:27:07 · 287 阅读 · 0 评论 -
数据分析师:2.1peewee模块写入数据库
初始化数据库并设计模型class 模型名称(Model) -> 一个class就是一张表from peewee import SqliteDatabasefrom peewee import Modelfrom peewee import CharField,DateField,ForeignKeyFielddb = SqliteDatabase('people.db')class Person(Model): name = CharField() birthday =原创 2020-09-09 17:31:58 · 397 阅读 · 0 评论 -
数据分析师:2.0peewee读取数据库数据
ORM(Object-Relational Mapping) 对象关系映射• 关系型数据库与Python代码之间做映射• 不需要直接写SQL语句• 通常以面向对象(Object-Oriented,OO)的形式对数据进行封装及交互安装模块pip install peewee原创 2020-09-09 08:47:19 · 1125 阅读 · 0 评论 -
学习笔记:python数据分析:10.数据就该这么玩2.2
安装财经数据接口模块pip install lxmlpip install tushare读取沪深300成分及权重import tushare as tsstock_df = ts.get_hs300s() # 读取沪深300成分及权重print(stock_df)运行结果:date code name weight0 2020-07-31 600000 浦发银行 0.731 2020-07-31 600004 白云机场 0.092 2原创 2020-08-14 21:06:42 · 218 阅读 · 0 评论 -
学习笔记:python数据分析:9.数据就该这么玩2.1
安装scikit-learnpip install scikit-learn直接load_iris()即可获取自带数据from sklearn import datasets # 导入数据集iris = datasets.load_iris() # 直接load_iris()即可获取自带数据print(iris)数据切分from sklearn import datasets # 导入数据集from sklearn import svmfrom sklearn.model_se原创 2020-05-25 13:36:09 · 133 阅读 · 0 评论 -
学习笔记:python数据分析:8.数据就该这么玩1.1
根据电影ID在douban_movie_data找出电影名和评分可以构造为一个函数来调用函数构造,根据电影ID返回电影名和评分def get_movie_name_and_score(movie_id): movie_link = 'https://movie.douban.com/subject/{}/'.format(movie_id) search_result = movie_data[movie_data['链接']==movie_link].iloc[0] movi原创 2020-05-25 10:54:53 · 413 阅读 · 0 评论 -
学习笔记:python数据分析:7.数据就该这么玩1.0
利用Python读取SQLite数据import sqlite3 # 导入SQLite3数据库模块import pandas as pd # 导入pandas模块conn = sqlite3.connect('douban_comment_data.db') # 连接数据库comment_data = pd.read_sql_query('select * from comment;',conn) # 读取数据print(comment_data) # 输出数据统计各个电影的评论数原创 2020-05-24 18:07:22 · 263 阅读 · 0 评论 -
学习笔记:python数据分析:6.Python + PyEcharts——数据可视化(下)
饼图Piefrom pyecharts.charts import Pie # 导入pyecharts图表模块的饼图from pyecharts.faker import Faker # 导入pyecharts随机虚构数据模块from pyecharts import options as opts # 导入图表配置模块pie = Pie()pie.add("", [list(z) for z in zip(Faker.choose(), Faker.values())])pie.原创 2020-05-23 16:19:03 · 391 阅读 · 0 评论 -
学习笔记:python数据分析:5.Python + PyEcharts——数据可视化(上)
为什么用Pyecharts与Echarts结合与Web端结合超强交互性国人开发的项目安装Pyechartspip install pyecharts图表绘制流程chart_name = 图表类型() 初始化具体类型图表。chart_name.add_xaxis() 添加横坐标名称。chart_name.add_yaxis() 添加纵坐标数据。chart_name.render() 生成 .html 文件。新建一个Python文件导入pyecharts模块及随机虚构数据模块f原创 2020-05-20 20:44:02 · 601 阅读 · 0 评论 -
学习笔记:python数据分析:4.Pandas数据合并、文件存取
两个DataFrame进行合并import pandas as pd # 导入pandas模块book_name = pd.DataFrame({ 'book_name':['a','b','c','d','e','f'], 'book_id':[11,22,33,44,55,66]})id_rating = pd.DataFrame({ 'book_id':[11,22,22,44,55,66,33,11], 'rating':[原创 2020-05-18 20:22:08 · 401 阅读 · 0 评论 -
学习笔记:python数据分析:3.Pandas数据结构DataFrame
创建一个DataFrame类型的数据import pandas as pd # 导入pandas模块dict_data = { "student":['lilei','hanmeimei','madongmei'], "score":[98,85,100], "gender":['M','F','F']} # 字典data = pd.DataFrame(dict_data) # 创建一个DataFrame类型的数据print(data) # 输出数据指定Dat原创 2020-05-17 19:18:10 · 296 阅读 · 0 评论 -
学习笔记:python数据分析:2.Pandas数据结构Series
安装Pandaspip install pandas创建一个Series类型的数据import pandas as pd # 导入pandas模块data = pd.Series([1,3,5,7]) # 创建一个Series类型的数据print(data) # 输出数据Series()里直接填一个由数字组成的列表import pandas as pd # 导入pandas模块list_data = [1,3,5,7] # 把列表赋给一个变量data = pd.Serie原创 2020-05-17 15:56:23 · 397 阅读 · 0 评论 -
学习笔记:python数据分析:1.Numpy基础 及基本应用
数据分析基础数组的概念数据处理的一般流程数据收集-数据预处理-数据处理-数据展示数据收集的方法网络爬虫公开数据集其它途径收集的数据数据预处理方法4. 归一化5. 二值化6. 维度变换7. 去重8. 无效数据过滤数据处理方法9. 数据排序10. 数据查找11. 数据统计分析数据展示方法列表图表动态交互图形安装Numpypip install numpy新建一个Python文件import numpy as np # 导入numpy模块导入Num原创 2020-05-15 15:57:01 · 351 阅读 · 0 评论