- 博客(35)
- 收藏
- 关注
原创 数据分析经验总结-基础工具篇
在这里插入图片描述](https://img-blog.csdnimg.cn/597a2efdd7430d9b7c646071aacf58.png。1.方便实用,但最大104W行,纯手工,无法沉淀数据处理流程,多表链接慢;分组运算中,groupby的列,在select前面必须筛选。deque在左边添加元素的时候,比list 快很多。上述中2,可以使用 A2&B2 效果是一致的。允许子类的方法和父类的方法一样。counter #计数器。AND 优先级大于OR。"%"匹配1个或多个。
2023-08-23 17:21:41 180
原创 Flask 相关学习
学习网文**1.**外部访问:app.run(host=“0.0.0.0”) 将run里面参数设置成“0.0.0.0”,在相同网络内访问:ip地址+端口 即可。
2021-01-08 11:14:52 355
原创 各路功能链接
用Python写界面–上位机开发关于pip install 安装Pyqt5 很慢 可以用pip install PyQt5-tools -i http://pypi.douban.com/simple --trusted-host=pypi.douban.com安装好的des在./Python/Lib/site-packages/pyqt5_tools/Qt/bin 里面环境变量配置,将PyQt5-tools的安装目录下qt/bin所在目录添加到系统环境变量path,就可以使用cmd启动desig
2020-07-10 14:25:49 355
原创 图解算法——书
第一章:引言1.二分查找使用二分查找时,最多需要检查log n个元素。其中log指的是log2def find_two(list,item): high=len(list)-1 low=0 while low <= high: middle = int((low + high) / 2) guess = list[middle]...
2020-06-17 21:21:17 226
原创 Python正则表达式
正则表达式1.正则表达式主要处理字符串,文本匹配的工具和库,不仅在python中使用,各编程语言都会用到。2.正则表达式的大致匹配过程是:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。3.python中正则数量词分贪婪模式和非贪婪模式贪婪模式总是尝试匹配尽可能多的字符;非贪婪的则相反,总是尝试匹配尽可能少的字符。例如:正则表达式"...
2019-12-10 13:43:40 710
原创 python数据可视化方法和库
之前的文章中学习了matplotlib和seaborn两种可视化库,但是实际工作由于自身问题其实直接调用pandas的接口比较多(直接df.plot()),然而根据实际可能图片的要求进行一些legend和label的改动。并且并不熟练!由于在网上看到许多酷炫的可视化图片以及动态图表的展示,因此此文主要为之后的数据分析可视化使用做一个参考。目前可视化的库和网站很多,针对个人可能会用到:1.在线...
2019-11-20 11:29:03 636 2
转载 Python标准库shutil,os
文件夹与文件操作(1):copyfileobj(fsrc, fdst, length=16*1024): 将fsrc文件内容复制至fdst文件,length为fsrc每次读取的长度,用做缓冲区大小fsrc: 源文件fdst: 复制至fdst文件length: 缓冲区大小,即fsrc每次读取的长度import shutilf1 = open("file.txt","r")f2 ...
2019-11-18 11:32:10 600
原创 数据分析项目: 链家房源分析
df["房型"].apply(lambda s:tt(s)).values.tolist()其中tt 是之前的设置的函数。上述代码是把apply后变成一个列表pd.DateFrame(df["房型"].apply(lambda s:tt(s)).values.tolist(),conlumns=["",""])时间的数据 最好 年月日 分开比较!cut() 切割pd.cut...
2019-07-23 18:11:57 822
原创 数据分析 NO.9 python进阶深入
python进阶深入1.生成器:创建生成器最简单的方法就是用圆括号()代替方括号 []把列表生成式的 [ ] 变成()生成器只能调用一次,不占用资源。用完就释放出来。for i in g: print(i)也可以调用Next函数直到计算出最后一个元素位置,但是这种方法很明显不适用,并且最后会抛出StopIteration的错误。斐波那契数列:除第一个和第二个数外,任意...
2019-05-23 14:42:58 453
原创 数据分析 NO.6 SQL练习题
SQL练习题– 1、 查询Student表中的所有记录的Sname、Ssex和Class列。SELECT Sname,Ssex,class FROM exercises2.student;– 2、 查询教师所有的单位即不重复的Depart列。SELECT DISTINCT(Depart) FROM exercises2.teacher;– 3、 查询Student表...
2019-05-17 00:46:30 860
原创 数据分析 NO.4 《MYSQL必知必会》6-11章
《MYSQL必知必会》6-11章where 在表名from后给出单引号用来限定字符串。如果将值与串类型的列进行比较,则需要限定引号。用来与数值列进行比较的值不用引号。BETWEEN 在某个区间SELECT *FROM xxwhere price BEWEEN 5 AND 10;NULL值 在过滤选择出不具有特定值的行时,不会返回他,因此在,过滤数据时,一定要验证返回数据中...
2019-05-15 00:11:14 138
原创 数据分析 NO.2 SQL与MYSQL进阶
SQL与MYSQL进阶分组计算:group byhaving 是分组后过滤,where是分组前过滤 用法相同子查询:嵌套在其他查询中查询用法:1 子查询在where里面做过滤 (也可以做表直接使用)2 作为计算字段使用1select district from world.city where disrtict in(select countrycode ...
2019-05-13 16:55:25 306
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人