qq_41584674
码龄7年
关注
提问 私信
  • 博客:8,790
    8,790
    总访问量
  • 37
    原创
  • 359,648
    排名
  • 1
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2018-01-04
博客简介:

qq_41584674的博客

查看详细资料
个人成就
  • 获得0次点赞
  • 内容获得2次评论
  • 获得0次收藏
创作历程
  • 37篇
    2018年
成就勋章
TA的专栏
  • markdown
  • python
    2篇
  • 爬虫
    1篇
  • 机器学习
    8篇
  • sklearn
    2篇
  • 分类算法
    1篇
  • 模型评估与选择
    1篇
  • 线性模型
    1篇
  • k-means
    1篇
  • 神经网络
    1篇
创作活动更多

新星杯·14天创作挑战营·第9期

这是一个以写作博客为目的的创作活动,旨在鼓励大学生博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。我们诚挚邀请你们参加为期14天的创作挑战赛! 注: 1、参赛者可以进入活动群进行交流、分享创作心得,互相鼓励与支持(开卷),答疑及活动群请见 https://bbs.csdn.net/topics/619626357 2、文章质量分查询:https://www.csdn.net/qc

474人参与 去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

神经网络

神经网络softmax用于计算所属不同目标值的概率损失函数交叉熵损失:Hy′(y)=−∑iyi′log⁡yiH_{y'}(y) = -\sum_iy_i' \log y_iHy′​(y)=−∑i​yi′​logyi​其中y′y'y′代表one-hot编码的真实结果值,yiy_iyi​代表softmax计算得到的概率优化方法反向传播...
原创
发布博客 2018.10.22 ·
168 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

k-means算法

非监督学习k:将数据划分为多少个类别过程:1、随即设置k个特征空间内的点作为初始的聚类中心2、对于其他每个点计算到k个中心的距离,未知的点选择最近的一个聚类中心点作为标记分类3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)4、如果计算得出的新中心点于原中心点一样,那么结束,否则重新进行第二步聚类评估标准:轮廓系数:sci=bi−aimax(bi,ai)sc_...
原创
发布博客 2018.10.22 ·
163 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

线性模型

线性模型对于给定d个属性的示例x=(x1;x2;...;xd)x = (x_1;x_2;...;x_d)x=(x1​;x2​;...;xd​)线性模型试图学得一个通过属性线性组合来进行预测的函数f(x)=w1x1+w2x2+w3x3+...+wdxd+bf(x) = w_1x_1+w_2x_2+w_3x_3+...+w_dx_d+bf(x)=w1​x1​+w2​x2​+w3​x3​+...+w...
原创
发布博客 2018.10.20 ·
240 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

模型评估与选择

过拟合学习能力过于强大,以至于把训练样本所包含的不太一般的特性都学到了欠拟合学习能力低下,不能准确的根据特性分类。泛化误差学习器在新样本上的误差训练误差学习期在训练集上的误差评估方法留出法将数据集划分为两个部分,一部分当成训练集,另一部分当成测试集交叉验证法将数据集D划分为k个大小相似的子集每次将k-1个子集当成训练集余下的子集当成测试集自助法对于包含m个样本的数据集...
原创
发布博客 2018.10.20 ·
156 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

分类算法

分类算法k近邻算法通过样本距离进行分类,取最近邻的k个数据数据集需要标准化朴素贝叶斯算法在特征独立的情况下进行分类算法:P(C∣W)=P(W∣C)P(C)P(W)P(C|W) = \frac{P(W|C)P(C)}{P(W)}P(C∣W)=P(W)P(W∣C)P(C)​W为给定文档的特征值,C为文档类别P(C)P(C)P(C)文档出现的概率P(W)P(W)P(W) 每个特征出现的...
原创
发布博客 2018.10.20 ·
251 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

数据库

三范式;第一范式(1NF):列不可拆分第二范式(2NF):唯一标识第三范式(3NF):引用主键spark直接对内存进行操作mapreduce对硬盘进行操作所以spark更高效...
原创
发布博客 2018.10.19 ·
114 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

数据的降维

方式:1、特征选择:主要方法:Filter(过滤式):VarianceThresholdEmbedded(嵌入式):正则化、决策树Wrapper(包裹式)Filter:删除低方差的特征。2、主成分分析:PCA:特征数量达到上百个时,使数据维数压缩,尽可能降低原数据的维数。当数据特征较多时,特征之间可能是相关的。...
原创
发布博客 2018.10.09 ·
167 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

特征预处理

概念:通过特定的统计方法姜数据转换为算法要求的数据方法:sklearn特征处理APIsklearn.preprocessing归一化:通过最大值和最小值对数据进行处理将数据转换为[0,1]之间的数,使得所有特征所占比例大致相同。缺点:对于异常点的处理不好,最大值最小容易受异常点影响(鲁棒性较差)标准化:通过平均值标准差对数据进行处理,将数据转换为平均值为0, 标准差为1 的数据。...
原创
发布博客 2018.10.09 ·
473 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

爬虫

网页三大特征:每个网页都有自己的url来定位网页都是用HTML来描述页面信息网页都是用HTTP/HTTPS鞋业来传输HTML数据爬虫的设计思路: 1.确定需要爬取的网页url地址 2.通过HTTP/HTTPS鞋业来获取对应的HTML页面 3。提取HTML页面里有用的数据为什么选择Python做爬虫:PHP:虽然是世界上最好的语言,但是对多线程、异步支持不好,并...
原创
发布博客 2018.09.12 ·
248 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

网络

socket模块:用于网络通信 udp协议:快但不稳定
原创
发布博客 2018.08.29 ·
136 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python垃圾回收

小整数常量池 python对[-5,256]内的整数是提前创建好的,不会被垃圾回收。同样大部分的字符串也是如此(不包含特殊符号) Garbage Collection(GC回收机制)
原创
发布博客 2018.08.28 ·
150 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python类的特殊方法

特殊属性: __slots__限定类,不能自由添加属性 __metaclass__:用特定方式来创建类def upper_attr(future_class_name,future_class_parents,future_class_attr): newAttr = {} for name,value in future_class_attr.items(): ...
原创
发布博客 2018.08.26 ·
294 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

生成器

In [6]: def test(): ...: i = 0 ...: while i < 5: ...: temp = yield i #通过send对temp赋值 ...: print(temp) ...: i += 1 ...:In [7]: t = test()In [8]:...
原创
发布博客 2018.08.26 ·
106 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python property

class Money(): def __init__(self): self.__num = 100 @property def num(self): print("...getter.....") return self.__num @num.setter def num(self,nu...
原创
发布博客 2018.08.23 ·
123 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

深拷贝、浅拷贝

a = [11,22,33]b = [44,55]c = a #浅拷贝a is c #Truea == c #Trued = [11,22,33]a is d #Falsea == d #Trueimport copye = copy.deepcopy(a)#深拷贝另外开辟一段地址e is a #Falsef = [a,d]g = copy.deepcopy(f)f[0]...
原创
发布博客 2018.08.23 ·
123 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

java第五天

集合与数组数组的长度是固定的,当超过数组的长度时,需要对数组重新定义,太麻烦,java内部提供了集合类,能存储任意对象,长度是可以改变的,随着元素的增加而增加 数组能存储基本数据类型和引用数据类型,集合只能存储引用数据类型,当存储基本数据类型时会自动装箱。 集合有两个子集合:List、Set List:有序(存和取的顺序一致),有索引,可以存储重复 三个字类: Set 无序,无索引不可以...
原创
发布博客 2018.08.19 ·
152 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

java 第四天

包package package语句只能是第一条可执行的代码 四种权限修饰符: private 本类中 默认(什么都不加):本类中、同一包下 protected:本类中、同一包下、不同包下(子类) public:都可用 内部类:在类中定义的类。 调用方法:外部类名.内部类名 对象名 = new 外部类对象.new 内部类对象outer.Inner oi = new oute...
原创
发布博客 2018.08.16 ·
135 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

java第四天

多态: 前提:1、要有继承关系。2、要有方法重写。3、要有父类引用指向子类对象。 子类对象在堆区存储时会分配一个空间存储父类(super)的成员class Test{ public static void main(String[] args){ Animal c = new Cat(); c.eat();//cat eat fish! ...
原创
发布博客 2018.08.07 ·
112 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

java第三天

java中如果有一个对象没有任何引用指向,那么该对象就会变为垃圾对象,java中有垃圾回收机制,会在不定时对其进行回收。 成员变量与局部变量 成员变量:在类中方法外。在堆内存(成员变量属于对象,对象进堆内存) 局部变量:在方法定义中或者方法声明上。(局部变量属于方法,方法进栈内存。) 生命周期 成员对象:随对象创建而存在,随对象消失而消失。有默认初始化值。 局部变量:随方法调用而存在,...
原创
发布博客 2018.08.07 ·
133 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

java第二天

键盘录入:import java.util.Scanner;class Input{ public static void main(String[] args){ Scanner sc = new Scanner(System.in); System.out.println("请输入一个整数"); int x = sc.nextI...
原创
发布博客 2018.08.05 ·
190 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多