![](https://img-blog.csdnimg.cn/926e7a5971bc4a8ba4591cd52a7091b0.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Captain重要代码(项目实操)
文章平均质量分 60
重要代码
Captain_Data
有问题可以私信交流呀~csdn当笔记用~
展开
-
分词模型与关键字提取——当下最热的学习资料是什么?
起因是我在朋友圈看到某位大牛在转让他的课程,正好最近也在学习,于是去咨询了一下,价格还好,于是就买下了~写下这篇nlp相关~原创 2022-07-26 00:23:56 · 596 阅读 · 2 评论 -
【Hive】实战之电商平台销售数据探索分析案例(含数据)
本文最早发表在csdn时间为:2021-12-08本案例数据链接(数据是本人业余时间模拟数据,为防止滥用设置价格4.9,需要的自行下载):数据点我下载数据来源为工作中接触到的某公司后台数据,在完成工作相关分析后,本人对该部分数据虚拟重建用以复盘整理大家好,我是Captain,一个从业两年的数据分析师。公主号:CaptainData学习是为了不落后,整理则是为了不忘记。通过本文您将学习到:hive 相关知识shell 命令电商销售数据主要探索方向开窗函数使用1、背景某电商平台为原创 2021-12-08 19:14:34 · 11629 阅读 · 0 评论 -
如何通过python requests 库xpath工具写一个抓取网站图片的小爬虫
有点爱好的你,偶尔应该会看点图片文字,最近小网站经常崩溃消失,不如想一个办法本地化吧,把小照片珍藏起来!首先,准备一个珍藏的小网站,然后就可以开始啦!第一步我们先写一个获取网站的url的链接,因为url常常是由page或者,其他元素构成,我们就把他分离出来,我找到的网站主页下有图片区图片区内有标题页,一个标题里有10张照片大概所以步骤是:第一步:进入图片区的标题页def getH...原创 2020-08-01 15:23:04 · 4290 阅读 · 2 评论 -
1.机器学习模型代码——聚类与评估参数
import sklearn.metrics as skmfrom sklearn import clusterimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport joblibdata=pd.read_excel("数据\\01.聚类数据1.xlsx")data <tr style="text-align: right;"> <th></th&原创 2021-06-27 02:39:19 · 436 阅读 · 0 评论 -
2.聚类模型优化与训练
1.数据 2.代码import sklearn.metrics as skm #评估包from sklearn import cluster #聚类分析import numpy as npimport matplotlib.pyplot as plt# from sklearn.externals import joblib #保存数据 pkl 已更新包import joblibd=pd.read_excel("数据\\03.聚类si数据.xlsx")d.index=d.企业d原创 2021-06-27 19:18:02 · 772 阅读 · 0 评论 -
3.机器学习模型代码——逻辑回归代码案例工作实操
import numpy as npimport pandas as pdimport mathdf=pd.read_excel("data.xlsx",dtype=str)df.describe() 随机值 公司Id 时间内注册公司数量(月) 注册地址重合 关联公司涉案 法人有涉案记录(总次数) 社保人数 纳税金额 法人过境记录 预测结果原创 2021-08-23 23:41:06 · 918 阅读 · 4 评论 -
小白实战:如何通过python requests 库xpath工具写一个抓取小网站图片的小爬虫
有点爱好的你,偶尔应该会看点妹子图片,最近小网站经常崩溃消失,不如想一个办法本地化吧,把小照片珍藏起来!首先,准备一个珍藏的小网站,然后就可以开始啦!完整代码在文末哦!!tips:vx:hsrjdz回复csdn或爬虫自动进群哦!!本次更新,加入history模块,可以随时暂停下载!!加入os库自动生成路径,每个文件夹存满490个图片后自动新建文件夹,方便你一键导入百度云哦!!全自动换文件夹存储,history模块def history(link): global picnameli原创 2020-09-30 10:44:56 · 584 阅读 · 0 评论 -
2021_w_.1.python 驱动MySQLdb(create_engine)代码
import pandas as pdimport numpy as npimport MySQLdbfrom sqlalchemy import create_engine# pip install mysqlclient# df = pd.read_sql(db_to_df_sql_list[i],con=mysql_conn)def cur_sql(sql_str,mysql_conn): mysql_conn=connect_mysql() cur =mysql_co原创 2021-11-29 15:41:22 · 1613 阅读 · 0 评论 -
2021_lg_03.SQL实战:如何用sql计算用户留存问题
如何用sql计算用户留存问题一、留存1 .留存的含义:留存:指基准日到APP的用户在之后的n日当天返回APP的人数;留存率 = 基准日之后的n天当日返回的用户数 / 基准日的用户数 * 100%或者指基准日产生某个行为的用户在之后的第一天,第二天,第三天……第n天的当天再次产生该行为的 人数。2.留存的意义留存代表一个用户愿意再次使用你的产品;而一个产品能够被用户再次使用,意味着这个产品是能够满 足用户长期需求的,能够让用户产生一定粘性的产品。如今互联网产品大多为免费产品,依靠持续的广告转化原创 2021-09-01 21:54:45 · 4234 阅读 · 0 评论 -
2021_w_.2.python驱动mysql(MySQLdb) 代码案例
数据库参数:# !/usr/bin/env python# -- coding: utf-8 --# @Time : 2021/7/9 11:09# @Author : wang vx:672377334# @File : 穿透sql转py.py# @software : PyCharmimport MySQLdbimport pandas as pdimport osdef read_mysql_conf(conf_path): conf_data = pd.rea原创 2021-11-29 15:14:22 · 1004 阅读 · 0 评论 -
2021_lg_01.sql_某招聘网站岗位数据分析案例(sql清洗,分析案例,纯代码)
库名:recruitment;1.新建库名#CREATE DATABASE IF NOT EXISTS recruitment DEFAULT CHARSET utf8 COLLATE utf8_general_ci; CREATE DATABASE recruitment CHARSET utf8;2.导入数据语句:mysql -uroot -p recruitment< [recruitment.sql(文件路径)]/*1.使用数据库*/use recruitment;原创 2021-09-04 03:33:18 · 359 阅读 · 0 评论 -
2021_lg_04.sql_2021窗口函数的使用与偏移函数在日期资金上的使用案例代码
/*一、建表、统计与程序异常分析(60分)1.1某公司地区业务有两张门店相关的表(数据见:homework.xlsx): 一张为门店信息表:表名:area_table字段内容 字段名 字段类型 长度店铺id store_id varchar 10店铺位置 area varchar 20店长id leader_id int*/drop TABLE if EXISTS area_table;CREATE TABLE area_table(store_id varchar(10)...原创 2021-09-01 02:48:43 · 516 阅读 · 0 评论 -
002项目 彩票系统:双色球
QQ:672377334VX:Wanghuiwen1996# -*- coding:utf-8 -*-import randommoney_sql=1000000lottery_rael=[]lottery_wins=[]#充值def recharge(): money_1=int(input("请输入充值金额(整数):")) global money_sql ...原创 2019-10-30 01:23:53 · 294 阅读 · 0 评论 -
爬虫:大淘客(淘宝商品数据) 5000--10000条数据
import requestsimport csvfrom lxml import htmlimport requestsimport timeimport jsonlistJson=[]JsonName='第5次DATAOKEdata.json'kv = {'User-Agent': 'Mozilla/5.0'}cid = 1contYM = 0# http://www.d...原创 2019-11-08 11:54:44 · 7253 阅读 · 0 评论 -
sql_数据分析之电商人货场模型分析之指标体系拆解+代码实操 (用户留存、RFM模型、 用户路径分析等)
2021-09-031.项⽬背景 随着电商⾏业近⼏年的迅猛发展,电⼦商务从早些年的粗放式经营,逐步转化为精细化运营。随着平台数据量的不断积累,通过数据分析挖掘消费者的潜在需求,消费偏好成为平台运营过程中的重要环节。本项⽬基于某电商平台⽤户⾏为数据,在MySQL关系型数据库,探索⽤户⾏为规律,寻找⾼价值⽤ 户;分析商品特征,寻找⾼贡献商品;分析产品功能,优化产品路径。...原创 2021-09-03 03:03:04 · 4173 阅读 · 0 评论