数据科学
mandala -chen
这个作者很懒,什么都没留下…
展开
-
使用jieba分词+pyecharts+request库爬取bilibili视频评论并统计词频可视化
环境:python 3.Xpyechartssnapshot_phantomjsnumpy as nppandas as pdjiebacodecsrequestsreossysjson#数据爬取 利用bilibiliapi接口# B站API详情 https://github.com/Vespa314/bilibili-api/blob/master/api.mdi...原创 2020-04-15 20:08:43 · 677 阅读 · 0 评论 -
在powerpoint中嵌入 pyecharts或echarts生成的交互式图
1、安装插件在powerpoint中搜索office apps选择获取加载项选择如下图所示名为 office Apps Fiddle for powerpoint 的加载项2、在写完pyecharts时我们可以使用以下代码直接导出html3找到我们导出的网页 查看网页源代码 把代码全部复制下来粘贴到我们的插件里面去然后点击三角形运行,他会有个报错不用管它×去就好 在点击那个小齿轮回...原创 2020-04-11 18:26:21 · 11798 阅读 · 5 评论 -
精选——国外知名的数据科学博客(一·)
A Blog From a Human-engineer-being http://www.erogol.com/Aakash Japi http://aakashjapi.com/Abhinav Sagar https://medium.com/@abhinav.sagarAdit Deshpande https://adeshpande3.github.io/Advanced Ana...原创 2020-01-05 02:43:28 · 314 阅读 · 0 评论 -
使用聚类分析 构建信用卡高风险客户识别模型
题目描述导入数据并查看数据集数据集地址"""import pandas as pdimport numpy as npdata=pd.read_csv("credit_card.csv")#查看数据集情况:data.info()data.describe()构建历史行为特征###历史行为特征#划分出历史行为特征数据data_active=data.iloc[:,[2,...原创 2019-12-16 14:44:43 · 9322 阅读 · 3 评论 -
pandas+pyecharts 数据可视化分析(数据可视化完整分析流程)使用数据集为 云南旅游数据集
在本文中使用pandas加pyecharts对云南旅游数据进行简单的数据可视化分析:参考资料:pyecharts、pandans手册#导入pandas相关的库并查看数据集情况import pandas as pd#from pyecharts import Bar, Line, Scatter, EffectScatter, Grid,Pie,WordCloud,Page,Style,Fu...原创 2019-12-07 17:52:37 · 8581 阅读 · 3 评论 -
使用openpyxl将Dataframe数据以Excel格式存储 解决csv格式导出数据错乱,和excel格式导出会有单元格字符限制问题
最近在写爬虫爬取文本数据中发现自己爬下来的文本数据太长,且里面有各式各样的符号,用csv格式存储的话会因为里面各种各样的符号(csv默认以逗号分隔)导致数据错乱乱码,用pandas库里面的to_Excel方法的话会因为这个方法会限制单个单元格里的字符长度而无法写入,openpyxl对pandas非常友好提供了方法可以直接导出数据,所以采用openpyxl库来进行写入话不多说直接上代码:from ...原创 2019-12-07 16:16:55 · 5074 阅读 · 0 评论