机器学习之决策树--使用微信公众号数据

本文通过分析微信公众号的数据,构建了一棵决策树模型,揭示了影响文章阅读量的关键因素。研究发现,标题吸引力、文章是否置顶、公司信息的提供以及公司政策与影响范围的大小,都是决定阅读量的重要因素。通过这些因素的组合,可以预测文章的阅读量是否会超过1000次。对于提升公众号文章的阅读量,提供了有价值的策略建议。
摘要由CSDN通过智能技术生成

使用微信公众号数据进行分析

# 导入包
import pandas as pd
import numpy as np
%matplotlib inline
%matplotlib notebook
import matplotlib.pyplot as plt
from numpy import *

from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']

import trees
import treePlotter
# 导入资料
fr = open('lenses.txt')
lenses = [inst.strip().split('\t') for inst in fr.readlines()]

lensesLabels=['标题吸引', '文章置顶', '公司信息', '公司政策','影响范围大']
lensesLabels

#lensesLabels2避免标签被更改
lensesLabels2 = lensesLabels[:]
# 构建决策树
lensesTree = trees.createTree(lenses,lensesLabels)
lensesTree

{'标题吸引': {'N': {'文章置顶': {'N': {'影响范围大': {'N': {'公司信息': {'N': {'公司政策': {'N': '<1K',
          'Y': '<1K'}},
        'Y': {'公司政策': {'N': '<1K', 'Y': '<1K'}}}},
      'Y': {'公司信息': {'N': {'公司政策': {'N': '<1K', 'Y': '<1K'}},
        'Y': {'公司政策': {'N': '<1K', 'Y': '<1K'}}}}}},
    'Y': {'影响范围大': {'N': {'公司信息': {'N': '>1K',
        'Y': {'公司政策': {'<1K': '<1K', '>1K': '>1K'}}}},
      'Y': {'公司政策': {'N': {'公司信息': {'N': '>1K', 'Y': '>1K'}},
        'Y': {'公司信息': {'<1K': '<1K', '>1K': '>1K'}}}}}}}},
  'Y': {'文章置顶': {'N': '>1K',
    'Y': {'公司政策': {'N': {'影响范围大': {'N': {'公司信息': {'<1K': '<1K', '>1K': '>1K'}},
        'Y': {'公司信息': {'<1K': '<1K', '>1K': '>1K'}}}},
      'Y': {'影响范围大': {'<1K': '<1K', '>1K': '>1K'}}}}}}}}
# 画出决策树
treePlotter.createPlot(lensesTree)

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值