- 博客(46)
- 收藏
- 关注
原创 Python 与数据科学实验(Exp10)
本次实验旨在了解正则表达式相关基本概念以及在网络爬虫中的应用,掌握Python正则表达式模块re的常见用法,初步学会运用基本的爬虫模块urllib,以及第三方库requests和Beautiful Soup,进行web数据的自动抓取实践。特殊字符的用法(a)正则表达式对象、匹配对象等概念(b)核心函数与方法:compile、findall、finditer、match、search、group、sub、split(a) url的概念(包括http协议、ftp协议等)、爬虫的工作流程。
2023-05-21 21:04:05
555
原创 ZGSOJ 1329 奇特的图形——欧拉回路
当时JacmY只懂得拿着铅笔随便画画试试,如果成功了,就说这个图能画下来,而他判断不能画下来的标准就是费了半天功夫都画不出来,当然这么做是不对的,特别当图形变得复杂时,JacmY是试不过来的。第一行一个整数T代表样例的组数 以下T组数据中,每组第一行是N,K,(2 <= N <= 100)分别代表当前图形有N个顶点,K条边,接下来K行中,每行两个整数X, Y( 1 <= X, Y <= N)代表顶点X和顶点Y之间有一条边。如果当前图形能按照题目要求描出来,则输出“YES”(不包括引号),否则输出“NO”。
2023-05-15 19:20:48
547
原创 Python 与数据科学实验(Exp9)
请注意,一般就识别问题而言,对于图像可能需要将不同图片的灰度值范围做标准化处理,如使得每一张图片的灰度值范围都相同。(1)将预测结果保存在名为“preds.txt”的文本文件中,内容为1000行, 每一行只有0-9数字中的一个数字,代表你的算法对测试数据的预测结果。(4)多分类的分类器请自学,如可以采用KNN,GNB,Logistic Regression,决策树,svm的SVC(from sklearn.svm import SVC)等。每一行为给定图片的灰度值,而每张图片代表的数值待建模识别。
2023-05-15 18:47:26
515
原创 DS W12
这篇实在是太6了……加了void*指针类型强制转换不然gcc可能会编译失败。需要调整一下格式(末尾无空格),用退格键不行\b,还是要用count==n?参考了下面这篇文章里的递归方法求解深度。比较坑,还好之前在王老师那道题碰到过销毁链表就出错的问题,(每行第一个是元素个数,不是用~scanf扫描)就可以解决多次生成销毁树带来的内存出错问题。思路和教材上是一样的,就是没有读清楚题目。/* 清除缓冲区 */了,如果不用这个的话。
2023-05-14 17:29:46
388
原创 Python 与数据科学实验(Exp8)
具体的机器学习算法不限,以预测效果最佳为目标,使用sklearn.metrics.f1_score的average=micro模式(https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html);将预测结果保存在名为“pred.txt”的文本文件中,内容为10000行, 每一行只有一个1-5分之间的分值,代表你的算法对测试数据的预测结果。标题', '评论'])),而每条商品的评分未知,待建模识别。
2023-05-08 18:59:04
694
原创 DS W10
1794 判断是否合法邮箱1830 广义表深度1831 B 输出广义表中的原子项【广义表】1835 C 广义表逆置【广义表】1874 D 行编辑程序。
2023-05-04 21:39:52
74
原创 Python 与数据科学实验(Exp7)
比如将某条蛋白质序列记为字符串pseq,则可分别计算子串pseq[ : : 2]和pseq[1: :2]的氨基酸组分。其中“2L8EA”为序列ID,1表示该蛋白质具有某种生物功能(反之,0表示蛋白质不具有这种生物功能),而“进而将构建好的分类器模型应用于测试集,给出全体未知标签样本的分类结果,即预测氨基酸序列为功能蛋白(文件中每一行若以空格隔开,内容分别是序列ID、类标号以及蛋白质的氨基酸序列。氨基酸组分,即每种氨基酸在蛋白质序列中的比例,可以表示为一个20维的向量。代表你的算法对测试数据的预测结果。
2023-04-24 19:15:25
306
原创 ZGSOJ 2355 : 稀疏矩阵相乘
输出为乘积矩阵或“No non-zero number exists!输入为两个矩阵(-1,-1,-1表示一个矩阵输入结束),如果程序中使用了二维数组将会违反内存50k的限制。时间限制: 1 Sec 内存限制: 0 MB。矩阵大小为1000行×1000列。使用三元组来存储矩阵。行下标,列下标,数值。
2023-04-19 19:48:16
107
原创 Python与数据科学 Scip
a[(0,1,2,3,4),(1,2,3,4,5)] : 用于存取数组的下标仍然是一个有两个元素的组元,组元中的每个元素都是整数序列,分别对应数组的第0轴和第1轴。第1轴是一个整数,选取第2列。格式: frompyfunc(func,nin,nout) 其中,ufunc是计算单个元素的函数,nin是输入参数的个数,nout是func返回值的个数。ndarray实例的属性 数组的大小可以通过其shape属性获得,还可以通过修改数组的shape属性,在保持数组元素个数不变的情况下,改变数组每个轴的长度。
2023-04-15 13:13:27
94
原创 Python 与数据科学实验(Exp6)
本次实验的目的是利用机器学习分类算法,基于训练集构建分类器模型,进而预测测试集中全体样本的分类结果,即。或者B或者C,代表你的算法对测试数据的预测结果。训练集数据共含与某种酒品质相关的11个(匿名)特征属性(另外请注意:只需提交结果文件,无需提交本次实验报告文件。本次实验成绩评定采用竞赛机制,即计算每位同学预测结果的。另有160条未知标签的测试数据,保存在“具体的机器学习算法不限,以预测效果最佳为目标。,然后由高到低进行排序评定相应的实验成绩。C(品质:A 优于 B,B优于C)。的文本文件中,内容为。
2023-04-14 14:20:38
686
原创 Python matplotlib 无法显示中文、字体缺失(Mac)
经过筛选发现Mac中matplotlib包含Heiti TC和Songti SC两种中文字体。Mac OS的字体设置和Win不一样,按照一般的流程下载SimHei再放到对应目录没有用。发现效果很不错,当成模板解决其他问题就好。
2023-04-13 15:31:16
2633
原创 Python 与数据科学实验(Exp5)
(1)。利用随机产生一个的二维数组,其元。完成以下该数组的索引任务,打印输出相关结果:(a) 使用索引方式获取第2行第5列、第6行第3列的元素。(b) 使用切片方式获取第3行至第5行和第4列至第6列的数据。(c) 使用切片与整数序列索引混合的方式,获取第3行至第5行且为第1列、第2列和第4列的数据。(d) 使用布尔索引方法将数组中取值大于1的元素重新赋值为10.00,小于-1的元素重新赋值为-10.00,并打印输出这个新数组。(2)利用numpy中相关模块。
2023-04-11 14:12:20
657
原创 ZGSOJ:1844 数组操作
在数组A[1..n]中有n个数据,试建立一个带有头结点的循环链表,头指针为h,要求链中数据从小到大排列,重复的数据在链中只保存一个。
2023-04-10 17:53:23
81
原创 【庸见辞典】flow by : rivers in youth
透明 transparent:与不可见的(invisible)同义,正如我们经常看到那些撞在玻璃上的鸟一样。
2023-04-08 12:00:40
69
原创 DS:W5~W7 线性表
DataStructure138 W5线性表 1199 表达式计算 1728 交换节点 1729 建立链表 1730 链表排列 1731 链表插 1734 删除线性表节点 1744 求链表交集
2023-03-19 21:48:46
271
原创 Python与数据科学实验(Exp2)
python描述:lnbos 数学公式 质因数分解 craps 计算日期 筛选整数 二进制转换 元素合并及计算 pow filter reduce
2023-03-17 09:17:07
122
转载 CAIL2018: A Large-Scale Legal Dataset for Judgment Prediction
In this paper, we introduce the Chinese AI and Law challenge dataset (CAIL2018), the first large-scale Chinese legal dataset for judgment prediction. CAIL2018 con- tains more than 2.6 million criminal cases published by the Supreme People’s Court of China
2023-01-19 20:31:36
841
原创 python实现jpeg转jpg
第三方库:pil image处理的图像存储在img,用image.open("路径")打开,然后用img.save("输出路径","文件类型",图像质量等参数)处理即可
2022-09-14 16:06:09
1386
原创 数据库原理 | 第2章 关系运算
关系数据语言基本集合运算 笛卡尔积 / 并集 / 差集 / 交集专用关系运算 选择 / 投影 / 连接 / 除运算
2022-02-28 19:49:42
947
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人