- 博客(59)
- 收藏
- 关注
转载 task8
bagging的案例分析(基于sklearn,介绍随机森林的相关理论以及实例)创建一个含有1000个样本20维特征的随机分类数据集:# test classification datasetfrom sklearn.datasets import make_classification# define datasetX, y = make_classification(n_samples=1000, n_features=20, n_informative=15,
2021-04-17 23:03:05 153
转载 task7
from sklearn.linear_model import LogisticRegression from sklearn.svm import SVC from sklearn.ensemble import VotingClassifierfrom sklearn.pipeline import make_pipeline from sklearn.preprocessing import StandardScalermodels = [('lr',LogisticRegr...
2021-04-15 00:12:24 168
转载 task6 掌握分类问题的评估及超参数调优
from sklearn.pipeline import make_pipelinefrom sklearn.preprocessing import StandardScalerfrom sklearn.svm import SVC'''C:正则化参数。正则化的强度与C成反比。必须严格为正。惩罚是平方的l2惩罚。kernel:{'linear','poly','rbf','sigmoid','precomputed'},默认='rbf'degree:多项式和的阶数gamma:“ rbf”,“
2021-03-29 22:24:57 187
转载 task5 掌握基本的分类模型
# 我们先来对未调参的SVR进行评价: from sklearn.svm import SVR # 引入SVR类from sklearn.pipeline import make_pipeline # 引入管道简化学习流程from sklearn.preprocessing import StandardScaler # 由于SVR基于距离计算,引入对数据进行标准化的类from sklearn.model_selection import GridSearchCV # 引入网格搜索调优
2021-03-27 22:54:29 260
原创 mysql: 【ERROR】 unknown option ‘--【client】 解决方法 修改my.ini
经历了如此痛苦终于进来了用下面的配置就可以了下载好mysql,建立my.ini然后对照上面图片的路径进行修好就好MySQL Server Instance Configuration File----------------------------------------------------------------------Generated by the MySQL Server Instance Configuration WizardInstallation Instruc.
2021-03-26 09:47:53 7029 1
原创 task4 掌握回归模型的评估及超参数调优
!pip install numpyRequirement already satisfied: numpy in c:\users\lenovo\anaconda3\lib\site-packages (1.19.2)!pip install pandasRequirement already satisfied: pandas in c:\users\lenovo\anaconda3\lib\site-packages (1.1.3)Requirement already satisfie
2021-03-24 17:20:20 605
原创 忽视future warning
from warnings import simplefiltersimplefilter(action='ignore', category=FutureWarning)
2021-03-16 11:34:06 401
原创 2021年3月5日
天气 雨细雨蒙蒙来到广州又认识了一个亲戚大佬在东南亚做电商的Shopee有点羡慕重新看了一遍python然后一下午的断网行为明天打算看数据结构over
2021-03-05 22:37:02 83
原创 2021年3月3日
天气晴今天温度忽冷忽热 注意保暖上午直播会议拍摄了解了云种植学院的相关内容整理拍摄素材书写公众号开会遇到的困难—无需要的帮助----无要提什么建议—无第一见上级领导hh最近一到下午就特别的困什么原因补充了维c、维b、葡萄糖酸锌考虑下午买些提神的东西...
2021-03-03 22:15:22 733 1
原创 2021年2月28日
天气 情晚上进行了圈地运动东圃商贸中心画上了印记回忆明天要准备的东西其一是总结其二是素材收集其三是换镜头盖子女朋友一个人备考加上准备开学心情不是很好要多陪陪她多理解她帮她做资料收集的工作更贴心才可以...
2021-02-28 23:19:36 97
原创 2021年2月27日
天气晴 洗了件大衣今天的天有点冷早餐大叔忽视了我的肠粉请求他失去了一位客户中午吃的螺蛳粉加腐竹美妙的组合安利今天学习的内容有点少就当一周下来的放松了明天继续fighting孤零零的小屋子映照着现实今天听到了一句话人是挣不到认知以外的钱的我挣不到一是时机不到二是太蠢了那就只有最笨的办法了脚踏实地的来吧gogo...
2021-02-27 22:01:02 146 2
原创 2021/2/26 总结
天气 阴雨绵绵元宵佳节赏花灯 猜灯谜拿到了公司的第一台电脑现在身家达到了一万 是个万元户了好好回忆一下今天的学习avatarify的学习制作吗咿呀嘿的效果动画化妆的神经网络算法了解了思路谷歌账号的注册通过Microsoft edge浏览器注册好久没用安卓安装谷歌框架不了了之商业修图学习皮肤中性灰的修饰尚硅谷的学习Java从入门到入坑我好菜虚心学习吧...
2021-02-26 19:49:10 123 1
原创 2021年2月22日 总结
天气炎热 穿着大衣出门第一天上班 摸鱼了一天可以申请将近六千的东西 有点出乎意料隔壁是算账报销的 可以多学点东西了工作很简单 给视频号发视频感觉大材小用了可能还没遇到难的吧先做好知识储备了每天要半小时英语 一小时自媒体学习 两小时Java编程感觉学着学着要去做界面设计了hhh愉快的一天...
2021-02-22 21:42:55 69
原创 2021年2月21日 总结
天气晴 早上的冷风让我有种感冒的感觉今天有空 慢慢走了这个小镇听说这边是拆迁区 人们的生活节奏过得很慢门口是一条河流 人们坐在河边聊天闲谈 坐的椅子看起来有十几年的历史了依稀记得是小时候的模样。让人遗憾的是不再是小时候见到过的河流那般清澈有活力。门口的杂货铺是专门买渔具的,河里还有这几扁小舟。想来以前的生机盎然。在这里,节奏很慢却又很快离这不远就是乡下了,开发程度不高。一条河流源远流长,害怕到不敢继续沿着河流跑下去。跑步的路上人烟罕至,有这很浓的年味—烟花味。最近手经常掉皮,是维生素补充不够
2021-02-21 19:42:31 268 3
原创 2021/20/20 总结
天气晴 适合晒衣服今天去了体检 吃了筒骨粉拉面 味道好鲜被抽血了针筒噗呲的就进去了 还来不及紧张就结束了下午在宿舍学习 宿舍好多粉尘 裤子好脏 考虑买个加湿器什么的还是搞好清洁 但看起来挺干净的 hh 看起来徒有其表 还是不适合住人看了很多前辈的新手道路 还是先迈出第一步 行动起来还有一天就要去上班啦 做好自己的工作吧现在的状态就像是以为自己什么都知道的满目自信hh 好像大家都会有这个阶段 害怕ing 多学习才更了解自己的不足啦保持谦逊 吸收养分ing...
2021-02-20 23:25:53 443 4
原创 年后第一天工作总结2021/2/19
天气冷冷的, 在办公室度过了面试的一个上午。 下午去了宿舍 一个很新的宿舍 。第一次出来吃很简陋的饭 ,住很简陋的房子 ,握着很少的钱, 哥哥说好的好呀。 年轻人不能一直待在家里, 现在体会到了一个人在外面的不容易 。本来想着技术不够就去自媒体,现在想来工资好低呀。重新看一遍ps的视频,恶补一下hh。...
2021-02-19 20:14:08 113
原创 Task04:查找2
两数之和class Solution: def twoSum(self, nums: List[int], target: int) -> List[int]: dic = dict() for i in range(len(nums)): if dic.get(target - nums[i]) is not None: return [dic.get(target - nums[i]),i] .
2020-08-28 22:40:44 118
原创 Task03:查找1
搜索插入位置class Solution: def searchInsert(self, nums: List[int], target: int) -> int: if not nums: return None left = 0 right = len(nums) - 1 if nums[left] == target: return left if nu.
2020-08-25 22:54:18 174
原创 Task02:动态规划
1 理解动态规划首先看定义:动态规划常常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时间往往远少于朴素解法。从定义中至少可以看出来三点要点:1.动态规划其实是分治算法的一种2.动态规划中动态的意思是要解决的问题,其规模不确定,而问题的解却依赖于问题规模3.能以较快速度(动态规划是一种泛用性算法,而泛用性算法与特定算法相比往往存在性能差距)将结果正确计算出来动态规划效率高的原因,是以空间换取时间。将前一步的结果储存起来,下一步可以直接调用,加速了计算速度。引用其他文章中的理解:动
2020-08-23 22:56:31 179
原创 Task01:分治
1.概述分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问题的答案。分治算法的步骤:分:递归地将问题分解为各个的子问题(性质相同的、相互独立的子问题);治:将这些规模更小的子问题逐个击破;合:将已解决的子问题逐层合并,最终得出原问题的解;2.leetcode 题目练习2.1 第169题. 多数元素使用分治class Solution(object): def
2020-08-19 22:31:43 173
原创 文件与文件系统
文件与文件系统open(file, mode=‘r’, buffering=None, encoding=None, errors=None, newline=None, closefd=True) Open file and return a stream. Raise OSError upon failure.file: 必需,文件路径(相对或者绝对路径)。mode: 可选,文件打开模式buffering: 设置缓冲encoding: 一般使用utf8errors: 报错级别newlin.
2020-08-08 21:59:58 884
原创 模块
在前面我们脚本是用 Python 解释器来编程,如果你从 Python 解释器退出再进入,那么你定义的所有的方法和变量就都消失了。为此 Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块(Module)。模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。什么是模块容器 -> 数据的封装函数 -> 语句的封装类 ->
2020-08-07 22:10:11 99
原创 类与对象与魔法
对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。【例子】class Turtle: # Python中的类名约定以大写字母开头 """关于类的一个简单例子""" # 属性 color = 'green' weight = 10 legs = 4
2020-08-05 20:32:06 112
原创 Task6 基于深度学习的文本分类3-BERT
Task6 基于深度学习的文本分类3-BERT微调将最后一层的第一个token即[CLS]的隐藏向量作为句子的表示,然后输入到softmax层进行分类。预训练BERT以及相关代码下载地址:链接: https://pan.baidu.com/s/1zd6wN7elGgp1NyuzYKpvGQ 提取码: tmp5import loggingimport randomimport numpy as npimport torchlogging.basicConfig(level=logging.I
2020-08-04 21:16:10 192
原创 函数与Lambda表达式
Lambda 表达式匿名函数的定义在 Python 里有两类函数:第一类:用 def 关键词定义的正规函数第二类:用 lambda 关键词定义的匿名函数python 使用 lambda 关键词来创建匿名函数,而非def关键词,它没有函数名,其语法结构如下:lambda argument_list: expressionlambda - 定义匿名函数的关键词。argument_list - 函数参数,它们可以是位置参数、默认参数、关键字参数,和正规函数里的参数类型一样。:- 冒号,在函数参
2020-08-02 23:10:59 181
原创 字典、集合和序列
字典可变类型与不可变类型序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。字典是 Python 唯一的一个 映射类型,字符串、元组、列表属于序列类型。那么如何快速判断一个数据类型 X 是不是可变类型的呢?两种方法:麻烦方法:用 id(X) 函数,对 X 进行某种操作,比较操作前后的 id,如果不一样,则 X 不可变,如果一样,则 X 可变。便捷方法:用 hash(X),只要不报错,证明 X 可被哈希,即不可变,反过来不可被哈希,即
2020-07-31 22:44:28 257
原创 Task5 基于深度学习的文本分类2-3TextRNN
TextRNNTextRNN利用RNN(循环神经网络)进行文本特征抽取,由于文本本身是一种序列,而LSTM天然适合建模序列数据。TextRNN将句子中每个词的词向量依次输入到双向双层LSTM,分别将两个方向最后一个有效位置的隐藏层拼接成一个向量作为文本的表示import loggingimport randomimport numpy as npimport torchlogging.basicConfig(level=logging.INFO, format='%(asctime)-15s
2020-07-31 22:22:04 220
原创 Task 4: 列表、元组和字符串
容器数据类型列表<class ‘list’>元组<class ‘tuple’>字典<class ‘dict’>集合<class ‘set’>字符串<class ‘str’>简单数据类型整型<class ‘int’>浮点型<class ‘float’>布尔型<class ‘bool’>...
2020-07-28 21:56:57 96
原创 Task4 基于深度学习的文本分类
学习目标学习FastText的使用和基础原理学会使用验证集进行调参FastTextFastText是一种典型的深度学习词向量的表示方法,它非常简单通过Embedding层将单词映射到稠密空间,然后将句子中所有的单词在Embedding空间中进行平均,进而完成分类操作。所以FastText是一个三层的神经网络,输入层、隐含层和输出层。Bag of Tricks for Efficient Text Classification, https://arxiv.org/abs/1607.01759
2020-07-27 22:08:15 112
原创 Task3 基于机器学习的文本分类
学习目标学会TF-IDF的原理和使用使用sklearn的机器学习模型完成文本分类文本表示方法 Part1在机器学习算法的训练过程中,假设给定N个样本,每个样本有M个特征,这样组成了N×M的样本矩阵,然后完成算法的训练和预测。同样的在计算机视觉中可以将图片的像素看作特征,每张图片看作hight×width×3的特征图,一个三维的矩阵来进入计算机进行计算。但是在自然语言领域,上述方法却不可行:文本是不定长度的。文本表示成计算机能够运算的数字或向量的方法一般称为词嵌入(Word Embe
2020-07-25 22:30:25 118
原创 Python标准异常总结
BaseException:所有异常的基类例外:常规异常的基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivisionError:除数为零AssertionError:断言语句(assert)失败AttributeError:尝试访问未知的对象属性EOFError:没有内建输入,到达EOF标记EnvironmentEr
2020-07-25 22:24:51 140
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人