自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 Day2-机器学习分类算法-阿里云天池

分类算法目标值:类别1.sklearn转换器和预估器2.KNN算法3.模型选择与调优4.朴素贝叶斯算法5.决策树6.随机森林3.1 sklearn转换器和预估器转换器估计器(estimator)3.1.1 转换器1.实例化(实例化的是一个转换器类(Transformer))2.调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)标准化:(x - mean) / stdfit_transformfit() 计算 每一列的平均值、标准差transfor

2020-12-23 22:34:07 233

原创 Day1-机器学习开发流程以及特征工程的初步探究-阿里云天池

机器学习开发流程## 获取数据## 数据处理## 特征工程## 机器学习算法训练 - 模型## 模型评估## 应用学习框架和资料介绍算法是核心,数据与计算是基础找准定位目标值:有 - 监督学习类别 - 分类问题(k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归)连续型的数据 - 回归问题(线性回归、岭回归)无 - 无监督学习(聚类 k-means)特征工程数据集学习阶段可用数据集:sklearn kaggle UCIsklearn工具介绍sklearn.datase

2020-12-20 21:01:51 173

原创 Python基础入门:Task4(day10)Python入门(口袋妖怪数据集探索)--阿里云天池

Task4 day01口袋妖怪数据集探索1.主要函数解释info() 用于快速浏览数据集信息,行列信息等 df.info() ''' <class 'pandas.core.frame.DataFrame'>RangeIndex: 801 entries, 0 to 800Data columns (total 41 columns):abilities 801 non-null objectagainst_bug 801 no

2020-09-15 21:05:22 704

原创 Python基础入门:Task3(day09)Python入门(下)--阿里云天池

魔法方法魔法方法的第一个参数应为cls(类方法) 或者self(实例方法)。魔法方法就是可以自动调用,不需要class.function1.基本的魔法方法init(self[, …]) 构造器,当一个实例被创建的时候调用的初始化方法class Rectangle: def __init__(self, x, y): self.x = x self.y = y def getPeri(self): return (self.x

2020-09-14 23:33:55 166

原创 Python基础入门:Task3(day08)Python入门(下)--阿里云天池

类与对象对象 = 属性 + 方法封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。class Turtle: # Python中的类名约定以大写字母开头 """关于类的一个简单例子""" # 属性 color = 'green' weight = 10 legs = 4 shell = True mouth = '大嘴' # 方法 def climb

2020-09-14 13:36:05 161

原创 Python基础入门:Task3(day07)Python入门(下)--阿里云天池

Task03 Day07函数函数的定义

2020-09-13 13:58:56 157

原创 Python基础入门:Task2(day06)Python入门(中)--阿里云天池

Task02Day03集合Python 中set与dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的keynum = {}print(type(num)) # <class 'dict'>num = {1, 2, 3, 4}print(type(num)) # <class 'set'>1.集合的创建用s = set(),不能用s = {},使用add添加keybasket = set()baske

2020-09-12 00:05:10 115

原创 Python基础入门:Task2(day05)Python入门(中)--阿里云天池

Task02 Day02字符串1.定义:Python 中字符串被定义为引号之间的字符集合。Python 支持使用成对的 单引号 或 双引号python的常用转义字符\反斜杠符号()'单引号"双引号\n换行\t横向制表符(TAB)\r回车原始字符串只需要在字符串前边加一个英文字母 r 即可三引号允许一个字符串跨多行,字符串中可以包含换行符、制表符以及其他特殊字符para_str = """这是一个多行字符串的实例多行字符串可以使用制表符TAB ( \t )。也可以使用

2020-09-11 10:41:52 180

原创 Python基础入门:Task2(day04)Python入门(中)--阿里云天池

Task02 Day01列表数据类型整型<class ‘int’>浮点型<class ‘float’>布尔型<class ‘bool’>容器数据类型列表<class ‘list’>元组<class ‘tuple’>字典<class ‘dict’>集合<class ‘set’>字符串<class ‘str’>1.列表的创建创建普通列表利用range()创建列表利用推导式创建列表

2020-09-10 10:44:40 204

原创 基于json文本爬取杭电宣讲会的信息

这是我们学院短学期的一个大作业了,其中使用json文本来爬取的,比较不常见,所以记录下来跟大家一起分享!看一下杭电宣讲会的网站(http://career.hdu.edu.cn/module/careers)先来说一下爬取目标...

2020-09-08 19:42:01 271

原创 Python基础入门:Task1(day03)Python入门(上)--阿里云天池

Day03异常处理1.Python标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivisionError:除数为零AssertionError:断言语句(assert)失败AttributeError:尝试访问未知的对象属性E

2020-09-08 19:29:17 111

原创 Python基础入门:Task1(day02)Python入门(上)--阿里云天池

位运算原码补码反码原码:就是其二进制表示(注意,有一位符号位)反码:正数的反码就是原码,负数的反码是符号位不变,其余位取反(对应正数按位取反)补码:正数的补码就是原码,负数的补码是反码+1按位运算:print(bin(4)) # 0b100print(bin(5)) # 0b101print(bin(~4), ~4) # -0b101 -5 按位取反print(bin(4 & 5), 4 & 5) # 0b100 4 按位与,从低位对齐开始print(

2020-09-08 11:25:13 126

原创 Python基础入门:Task1(day01)Python入门(上)--阿里云天池

注意点算数运算符:**(幂)位与运算符:print(bin(4)) # 0b100print(bin(5)) # 0b101print(bin(~4), ~4) # -0b101 -5 按位取反print(bin(4 & 5), 4 & 5) # 0b100 4 按位与,从低位对齐开始print(bin(4 | 5), 4 | 5) # 0b101 5 按位或,从地位对齐开始print(bin(4 ^ 5), 4 ^ 5) # 0b1 1 按位异或print(b

2020-09-07 13:44:45 150

原创 基于python对豆瓣Top250进行影片信息爬取

爬取目标:爬取影片片名、影片链接、影片上映日期、影片上映地点、影片导演、影片主演、类型、评分、评价人数、好评率、影片评价输入:豆瓣top250url(https://movie.douban.com/top250)输出:包含影片信息的excel表格技术路线: 爬取:使用了request库对网页信息进行整体爬取解析:使用parsel+xpath和bs4+re库进行解析保存:xlwt库进行excel写入和保存操作数据分析:通过pyecharts库与百度上的开源库Echarts进行对接,对爬取到的数据

2020-07-29 10:25:09 1099

原创 基于python爬虫的对ip地址进行归属地查询

目标:实现对ip地址的归属地查询语言:python获取方式:爬取网页信息代码# import requests# url = "http://m.ip138.com/ip.asp?ip="# try:# r = requests.get(url + '202.204.80.112')# r.raise_for_status()# r.encoding = r.apparent_encoding# print(r.text)# except:#

2020-07-29 10:22:12 1128

原创 基于python+webdriver实现杭电正方系统的自动化抢课程序

废话不多说,上程序代码import requestsfrom selenium import webdriverfrom selenium.webdriver import ChromeOptionsimport parselimport timefrom selenium.webdriver.common.action_chains import ActionChainsfrom selenium.webdriver.common.by import Byimport jsonimp

2020-07-24 23:02:45 998

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除