自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 数据分析经验总结-基础工具篇

在这里插入图片描述](https://img-blog.csdnimg.cn/597a2efdd7430d9b7c646071aacf58.png。1.方便实用,但最大104W行,纯手工,无法沉淀数据处理流程,多表链接慢;分组运算中,groupby的列,在select前面必须筛选。deque在左边添加元素的时候,比list 快很多。上述中2,可以使用 A2&B2 效果是一致的。允许子类的方法和父类的方法一样。counter #计数器。AND 优先级大于OR。"%"匹配1个或多个。

2023-08-23 17:21:41 180

原创 Flask 相关学习

学习网文**1.**外部访问:app.run(host=“0.0.0.0”) 将run里面参数设置成“0.0.0.0”,在相同网络内访问:ip地址+端口 即可。

2021-01-08 11:14:52 355

原创 各路功能链接

用Python写界面–上位机开发关于pip install 安装Pyqt5 很慢 可以用pip install PyQt5-tools -i http://pypi.douban.com/simple --trusted-host=pypi.douban.com安装好的des在./Python/Lib/site-packages/pyqt5_tools/Qt/bin 里面环境变量配置,将PyQt5-tools的安装目录下qt/bin所在目录添加到系统环境变量path,就可以使用cmd启动desig

2020-07-10 14:25:49 355

原创 图解算法——书

第一章:引言1.二分查找使用二分查找时,最多需要检查log n个元素。其中log指的是log2def find_two(list,item): high=len(list)-1 low=0 while low <= high: middle = int((low + high) / 2) guess = list[middle]...

2020-06-17 21:21:17 226

原创 pandas相关性能以及工作总结

关于python相关应用参考

2019-12-11 16:06:33 2690 1

原创 Python正则表达式

正则表达式1.正则表达式主要处理字符串,文本匹配的工具和库,不仅在python中使用,各编程语言都会用到。2.正则表达式的大致匹配过程是:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。3.python中正则数量词分贪婪模式和非贪婪模式贪婪模式总是尝试匹配尽可能多的字符;非贪婪的则相反,总是尝试匹配尽可能少的字符。例如:正则表达式"...

2019-12-10 13:43:40 710

原创 python数据可视化方法和库

之前的文章中学习了matplotlib和seaborn两种可视化库,但是实际工作由于自身问题其实直接调用pandas的接口比较多(直接df.plot()),然而根据实际可能图片的要求进行一些legend和label的改动。并且并不熟练!由于在网上看到许多酷炫的可视化图片以及动态图表的展示,因此此文主要为之后的数据分析可视化使用做一个参考。目前可视化的库和网站很多,针对个人可能会用到:1.在线...

2019-11-20 11:29:03 636 2

转载 Python标准库shutil,os

文件夹与文件操作(1):copyfileobj(fsrc, fdst, length=16*1024): 将fsrc文件内容复制至fdst文件,length为fsrc每次读取的长度,用做缓冲区大小fsrc: 源文件fdst: 复制至fdst文件length: 缓冲区大小,即fsrc每次读取的长度import shutilf1 = open("file.txt","r")f2 ...

2019-11-18 11:32:10 600

原创 数据分析项目: 链家房源分析

df["房型"].apply(lambda s:tt(s)).values.tolist()其中tt 是之前的设置的函数。上述代码是把apply后变成一个列表pd.DateFrame(df["房型"].apply(lambda s:tt(s)).values.tolist(),conlumns=["",""])时间的数据 最好 年月日 分开比较!cut() 切割pd.cut...

2019-07-23 18:11:57 822

原创 数据挖掘 NO.3 sklearn

sklearn

2019-07-19 18:34:29 236

原创 数据挖掘 NO.2 模型效果评估

模型效果评估

2019-07-05 19:00:33 473

原创 数据挖掘 NO.1 数据挖掘入门

机器学习入门

2019-07-01 15:29:52 296

原创 数据分析 NO.23 多元线性回归

多元线性回归

2019-06-28 16:19:31 681

原创 数据分析 NO.22 简单的线性回归

线性回归

2019-06-27 21:57:02 293

原创 数据分析 NO.21 方差检验

2019-06-26 18:31:33 461

原创 数据分析 NO.20 假设检验

假设检验

2019-06-19 15:47:04 766

原创 数据分析 NO.19 抽样与区间估计

抽样与区间估计

2019-06-18 15:18:45 367

原创 数据分析 NO.18 概率分布

概率分布

2019-06-18 15:17:17 227

原创 数据分析 NO.17 描述统计

描述统计

2019-06-12 21:25:06 259

原创 数据分析 NO.16 摩拜单车数据分析项目

摩拜单车数据分析项目

2019-06-05 16:31:46 2681 5

原创 数据分析 NO.15 数据可视化

数据可视化

2019-06-05 16:30:39 3264 2

原创 数据分析 NO.14 科赛网Pandas练习题

Pandas练习题

2019-06-02 00:35:00 2589 2

原创 数据分析 NO.13 Numpy科学计算

Numpy科学计算

2019-05-29 15:44:10 641

原创 数据分析 NO.12 pandas数据管理

pandas数据管理

2019-05-29 15:43:25 1470

原创 数据分析 NO.11 《Python从入门到实践》8-10章

《Python从入门到实践》8-10章

2019-05-26 23:53:18 404

原创 数据分析 NO.10 《Python从入门到实践》2-7章(含练习题)

《Python从入门到实践》2-7章

2019-05-25 23:58:03 647

原创 数据分析 NO.9 python进阶深入

python进阶深入1.生成器:创建生成器最简单的方法就是用圆括号()代替方括号 []把列表生成式的 [ ] 变成()生成器只能调用一次,不占用资源。用完就释放出来。for i in g: print(i)也可以调用Next函数直到计算出最后一个元素位置,但是这种方法很明显不适用,并且最后会抛出StopIteration的错误。斐波那契数列:除第一个和第二个数外,任意...

2019-05-23 14:42:58 453

原创 数据分析 NO.8 PYTHON 入门(含3道题)

PYTHON 入门

2019-05-22 03:47:13 602

原创 数据分析 NO.7 牛客网MYSQL练习题

牛客网MYSQL练习题

2019-05-18 21:37:44 317

原创 数据分析 NO.6 SQL练习题

SQL练习题– 1、 查询Student表中的所有记录的Sname、Ssex和Class列。SELECT Sname,Ssex,class FROM exercises2.student;– 2、 查询教师所有的单位即不重复的Depart列。SELECT DISTINCT(Depart) FROM exercises2.teacher;– 3、 查询Student表...

2019-05-17 00:46:30 860

原创 数据分析 NO.5 《MYSQL必知必会》12-17章

《MYSQL必知必会》12-17章

2019-05-15 13:12:12 163

原创 数据分析 NO.4 《MYSQL必知必会》6-11章

《MYSQL必知必会》6-11章where 在表名from后给出单引号用来限定字符串。如果将值与串类型的列进行比较,则需要限定引号。用来与数值列进行比较的值不用引号。BETWEEN 在某个区间SELECT *FROM xxwhere price BEWEEN 5 AND 10;NULL值 在过滤选择出不具有特定值的行时,不会返回他,因此在,过滤数据时,一定要验证返回数据中...

2019-05-15 00:11:14 138

原创 数据分析 NO.3 《MYSQL必知必会》1-5章

2019-05-13 16:57:02 621

原创 数据分析 NO.2 SQL与MYSQL进阶

SQL与MYSQL进阶分组计算:group byhaving 是分组后过滤,where是分组前过滤 用法相同子查询:嵌套在其他查询中查询用法:1 子查询在where里面做过滤 (也可以做表直接使用)2 作为计算字段使用1select district from world.city where disrtict in(select countrycode ...

2019-05-13 16:55:25 306

原创 数据分析 NO.1 SQL与MYSQL入门

内容:SQL与MYSQL入门基于workbenchSHH:是连接服务器常规:是连接数据库

2019-05-11 23:27:36 588

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除