自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(77)
  • 收藏
  • 关注

原创 python的多线程与多协程

python的多线程与多协程

2022-08-22 09:16:09 398

原创 浅谈 redis

浅谈 redis

2022-08-12 09:53:35 165

原创 sklearn 的 knn 用法

sklearn 的 knn 用法

2022-08-10 10:07:08 376

原创 sklearn的 fit 和 predict 使用

sklearn的 fit 和 predict 使用

2022-08-10 09:32:44 1345

原创 python 装饰器

装饰器是一种函数,它可以修改其他函数的功能。

2022-08-08 21:52:47 194

原创 python 迭代器和生成器

python 迭代器和生成器

2022-08-08 09:50:01 145

原创 快速启动一个 http 服务

快速启动一个 http 服务

2022-07-26 17:20:37 167

原创 java面试

string、stringbuffer、StringBuilder的区别:string赋值变化后是个新的对象,stringbuffer赋值变化后还是原来的对象 string是不可变对象,String、Integer及其它包装类.不可变对象最大的好处是线程安全.。 string、stringbuffer都是线程安全,StringBuilder是线程不安全的。 为什么是线程不安全:count += len;不是一个原子操作。假设count的值是10,len的值为1,两个线程同时执行到了第七行,拿到的.

2020-07-01 09:59:31 175

原创 20181030 - 做事方法论

做事方法论:1、看一看,聊一聊,找一找工具。避免越努力越焦虑。2、whywhy改进,从不一样的角度出发。3、事后复盘,讲3个优点,2个缺点。

2018-10-30 10:00:58 426

原创 20180904 - 香农shannon三板斧

香农定理:保证质量的前提下,给出了能够在一个通道上传输的速度的上限。没有给出如何达到这个上限。类比:从A点开车到B点,在尽可能保证能够到达B点的前提下,求开车速度V最快能多快?假设:路宽为W,路上的汽车数量为S(有效信号),路上的红绿灯数量为N(随机噪声)。则:Vmax = W * log2(1 + S/N)。举例:有线电话通话时,人耳能够听到的音频频率范围为300Hz ~...

2018-09-04 09:45:16 258

原创 20180827 - 工作感想

老跟着别人很累,而且当前热点追不完(抖音、哈罗单车...)。从心里最深处出发做产品,找到感觉。1、认清自己优势:高效分发转化能力。根据优势,找到目标:做集大成者,少有人比我做的更好。根据目标,制定战略:开放平台、基础支持、共同协作产生更多可能。根据战略,下定决心:找到迫在眉睫的感觉,必须做出来。根据决心,活在当下:想想能改变些什么(降低门槛普及-开源开放,挑战带来机遇-医疗平台自建)...

2018-08-27 22:19:49 206

原创 20180816 - 红黑树

二叉搜索树:左边的小于等于中间的,中间的小于等于右边的。不一定是完全二叉树。可以是类似一个链表(搜索效率不高O(n),插入和删除)。为了提升效率,而且找到了一种提升效率的方法,就是红黑树。给二叉搜索树更多的限制条件和稍微一点的存储空间,就能够换来搜索效率O(logn)。A、为什么能够保证搜索效率为O(logn)?因为有定理证明,红黑树的最长路径比最短路径最多长一倍。控制了树的高...

2018-08-16 22:04:47 190

原创 20180812 - 《算法导论》-1

以下是个人的默写内容,如有错误,请留言指正,谢谢。1、冒泡排序:bubbleSort从前往后,两两比较,将大的放到后面。长度递减循环。稳定、原址、O(n2)2、插入排序:insertSort从前往后,最新的那个和旧有的所有进行比较,找到最新在旧有中的位置。稳定、原址、O(n2)3、归并排序:mergeSort:将数组分位两个分区,对每个分区进行插入排序后,再合并。合并方法:A...

2018-08-12 23:30:28 206

原创 20180807 - Spark快速大数据分析

Spark快速大数据分析概念数据的两个方向:数据科学:分析+建模(回答业务问题、挖掘潜在规律、辅助产品推荐)数据处理:硬件(内存、集群)+软件(封装、接口、监控、优化)框架应用层:SparkStreamingSparkSqlSparkGraphxSparkMLlib中间层:SparkCore分布式集群部署:Standalone(Spark自带),YA...

2018-08-07 14:30:55 271

原创 20180807

学习方法论:强调大脑的自主学习。1、间隔学习大于整段学习。10-20分钟的间隔,可以让大脑的得到休息,产生更丰富的想象和反思。2、考试默写大于重复学习。学习好几遍不如设定几次考试,能让大脑记得更久,更深入。3、交替学习大于刻意学习。交替是指不按照既定的顺序和流程学习,而是让大脑能够有多方面联想对比。刻意是指按照套路一步一步学习,看起来逻辑性强,其实是给大脑设定好了学习模式,没有释放出大...

2018-08-07 09:16:15 145

原创 20180806 - 知识整理-大数据分析的道与术

10大知识领域:整合、范围、进度、成本、质量、人力资源、沟通、风险、采购、干系人----------------------------------------------------------------------------------------------------------------------------------------------------------商...

2018-08-06 11:04:47 977

原创 20180804 - 《现代操作系统》

1、计算机结构:处理器(CPU):取指令-解码-执行。包含寄存器、进程/线程的执行指令。CPU是按时序进行执行的,多进程从纳秒级别看,是顺序执行。        寄存器:下一条指令的内存地址、堆栈指针、状态字/程序切换。        超进程:一个CPU同时为多个进程服务(默认是一对一顺序),进程有最大数量限制。系统中理论上最大的进程数是4090。linux 系统中单个进程的最大线程数...

2018-08-04 23:43:44 241

原创 机器学习 - 20180624

机器学习:    基于数据的分析,得出数据的规律,从而指导现实的决策。收集数据,并将数据做归一化处理。你事先大概知道数据的输入和输出之间的关系:        你想要连续的预测结果:梯度下降/线性回归,正规方程。回归问题。        你想要离散的预测结果:逻辑回归。分类问题。你事先一点也不知道数据的输入和输出之间的关系:        你想知道这些数据可以分为几类:将相似的数据放到一起。聚类问...

2018-06-24 01:30:36 213

原创 机器学习 - 样本处理

样本处理:模型冷启动: 构建专家规则模型(前期比机器学习模型重要) 平滑过渡:充分部分优先切换 产品->数据->产品的重要性 数据技术不是核心竞争力,但数据是。 样本分布不一致的解决方案: 不一致会有什么问题?样本数据和实际数据的分布不一致。 难点在于发现(意识到) 需要清楚产品需要什么样本不平衡的解决方案: 样本不平衡的问题:分布的比例偏差较大,把小样本进行扩充 原理解析 两种等价...

2018-06-18 22:01:13 1213

原创 机器学习-4

实践 问题建模 建模是实现业务的部分 不同的业务目标导致不同的模型 分类 内容是否有价值 回归 内容明天的浏览量 排序 给搜索词确定内容的展现列表 推荐 给用户历史浏览确定内容的展现列表 我们想要什么 模型预测的Y是什么 往往会想很多X特征 我们想干什么 两种检索系统 网页的检索系统 离线建库 在线检索:解析-触发-排序 排序任...

2018-06-15 08:42:43 211

原创 关键词竞价

拍卖:买家的报价估价买家的付款方式商品的分配方式私人价值-别人估价对我没影响关联价值-别人估价对我有影响公共价值-真正价值不会变,只是参与人估价不同买家报价和买家真实想法:英式拍卖:设一个低价,报价高得荷兰式拍卖:从高往低拍卖,沉默拍卖。第一价格密封拍卖:建筑价格,按照最高价计算第二价格密封拍卖:按照次高价计算机制设计:解决冲突,设计目标要明确委托人:卖方代理人:收益社会价值,吸引更多的用户关键词...

2018-06-06 15:02:38 515

原创 feed - 1

feed=推荐,区别于搜索。搜索是PC时代,推荐是移动时代。两份数据:用户的数据(又分两类)。        推荐中的行为数据、搜索中的行为数据、大数据画像(用户人口属性)(神经网络建模输出匹配度)        user-item点击、用户地理位置、手机常用app(神经网络建模输出相似性)推荐的数据。        从用户数据中提取长期或短期兴趣特征。        将兴趣特征和推荐数据进行匹配...

2018-06-05 09:29:03 189

原创 机器学习 - 4

分类问题:SVM:回归问题:kernel函数的选取:线性kerl多项式kerl高斯kerl高维到低维:特征更少,表达更简单。1、样本量2、维度爆炸3、性能考虑图像技术:人工智能具备视觉能力图像的特征:最直接的想法:计算像素的相似性。除了像素的表达,可能还有更多的表达SIFT特征:(分类问题)    使用视觉不变的局部特征标定物体。 纹理:特征点与周围点的梯度变化。 考虑四个因素:遮挡、位置、尺度、...

2018-06-01 08:33:41 193

原创 机器学习-3

正则化(考虑大数定律,限制参数取值范围,加入超参数):1、减少样本误差2、减少大数定律的误差(实际与预测的误差)原优化目标(均方误差)新优化目标,加入正则化项(大数定律带来的误差)正则化项的设计与调参:稀疏解 - L1范式校验validation:1、常识性的观察法。2、样本误差不能作为正则化项超参数的选择标准。3、out = train(假设空间内最优假设) + validation(最优假设空...

2018-05-31 20:53:56 157

原创 机器学习-2

四步曲:怎么学到为何能学如何强大怎么学好80%精力在模型之外基于概率的信任(大数定律)两个思想:所有信息都观测到的情况下,结果是否能够确定。1、定值:频率学派。先验分布是不变的。2、分布:贝叶斯学派。根据观测的数据改变先验的分布。1、世界是确定的:因果律与经典物理。2、不确定性与量子物理:哥本哈根学派。只能保证在已有样本上是有效的。怎样保证对未来的数据也有效?1、增加假设空间中的假设的数量。2、将...

2018-05-30 23:41:37 213

原创 机器学习 - 1

使优化目标达到最好的假设。假设是历史观测中表现最好,是不是在未来也表现最好?需要验证。1、过拟合2、正则化3、校验评估方法有哪些?1、假设空间线性关系2、优化目标均方误差最小3、寻解算法导数为0,微分方程假设的设定:回归场景:线性回归:线性关系(实数域)。分类场景:1、分类假设,感知机(阶跃函数):输出类别的编号(概率=1)。2、概率假设,逻辑回归(sigmod函数):输出类别的概率。优化目标:线...

2018-05-30 08:37:13 228

原创 加入熊厂,越努力,越迷茫

2018-11-08加入熊厂。2018-02-08,三个月了。为什么在这段日子里,有一种感觉比较强烈。就是,自己年纪大了,不再有青春的拼搏的动力,而是得过且过的心态更多些。年纪带来了恐惧感,带来了一丝丝的中年焦虑。我相信很多30-40岁的人,会面临着同样的问题。首先,说清楚问题。然后,承认这个问题。最后,接受这个问题。...

2018-02-10 12:33:32 793

原创 20171209 生活随笔-让自己的工作和生活都能够有所好转

很久没有来这里了。今天是2017年12月09日,我和亲亲一起入住在上海的万达瑞华酒店,是江景房。别羡慕,这个是亲亲公司出钱的旅游项目,自己不花钱的。现在我就坐在落地窗的前面,面对着黄浦江和对面的东方明珠电视塔、上海中心等知名建筑。正对面就是当年最贵的 “汤臣一品”。晚上23点整,对面的 “震旦” 和 citi 两栋楼的 广告 已经休息了。汤臣一品也只剩下寥寥几束灯光。从灯火通明转为了一

2017-12-09 23:59:07 338

原创 聊聊网络中的三层路由

讲三层需要先讲二层。二层 = mac + vlan表 + 二层转发有mac+vlan和端口对应的源mac+vlan地址表。进来的报文,找对应的目的mac+vlan端口,如果找不到,则在vlan中洪泛。三层 = 二层 + 三层路由表 + 路由选择 + 路由转发进来的报文的目的mac是该设备的mac,表示该报文需要通过该设备进行转发。如果不是,则按照二层转发。维

2017-10-30 20:16:53 5566 1

原创 《编写高质量代码 改善Python程序的91个建议》读后程序学习小结

# coding=utf-8# Language Reference'''参考书:《编写高质量代码 改善Python程序的91个建议》张颖,赖勇浩 著 2014.6'''from __future__ import with_statement# assertx, y = 1, 1assert x == y, "not equals"# time计时的两种方式import

2017-09-28 12:38:42 1323

原创 python 关于循环链表的实现 - 从哪里倒下,就从哪里站起来

问题:循环链表的检查构造一个单向循环链表。输出是否有循环,循环的长度,开始循环的节点。例:a-b-c-d-e-f-g-h-i-j-k-l-m-n-e有循环e-f-g-h-i-j-k-l-m-n-e循环长度为10开始循环的节点为e解决方案:在头节点前增加一个空节点,便于一致性处理。采用两个变量x, y从空节点开始分别遍历该链表。变量x按顺序遍历每一个节

2017-09-21 19:28:47 1849

原创 python - 用遗传算法解决0-1背包问题,遗传算法是基于概率论的,因此不一定能一次命中最优解

# coding=utf-8'''贪心算法:局部最优解。动态规划算法:多目标、多阶段优化。穷举算法:万能,受问题规模限制。遗传算法:只是比漫无目的的穷举搜索算法聪明一点点,通过较小的计算量获得较大的收益。只要能用解析的方法直接得到的最优解问题,都不要试图用遗传算法。适合-非线性问题。人工智能、自适应控制、机器学习等领域。不依赖目标函数。基于概率论,而不是一个确定的搜索过程,即每一

2017-09-20 17:25:29 3244

原创 python - 遍历某个文件夹下的所有子文件夹和文件名称

“只有提升维度,不断抽象,才能够看清低维度的事物的本质。”  -  柏拉图-理想国 问题:遍历系统某个文件夹下面的所有子文件夹和文件,输出子文件夹的文件的名称。解决方案:获取系统文件夹的路径,创建一个字典。列出当前文件夹下的文件夹和文件,文件夹存储为字典的key1,文件存储为字典的key2。遍历字典中的每一个文件夹和文件讨论:当文件/文件夹名称为汉字时,没有进行

2017-09-18 16:29:18 14560

原创 python - 数独问题 - 固定范围实现 - 动态调整格子的可选范围没有实现

数独问题给定9*9的格子,要求每个3*3的小格子填的数字1-9,横线、竖线、斜线填1-9。初始条件是给出随机18个数字。(最少17个数字才能得出解)解可能不唯一类似穷举,1-先结合初始条件,遍历每个格子,找到剩余格子可能的取值范围。2-从最开始的格子中挑选一个数,然后重新计算剩余格子的可能取值范围。格子的影响范围为横线、竖线,以及3*3小格子,因此,只需要重新计算这块区

2017-09-13 10:38:54 529

原创 python - 穷举算法

穷举算法字母代表0-9十个数字中的一个,且不重复。wwwdot - google = dotcom公式中首位不能为0。求出各个字母代表的数字,符合该公式。 W - 1-9G - 1-9D - 1-9O - 0-9T - 0-9L - 0-9E - 0-9C - 0-9M - 0-9穷举以上。For循环。耗时太长,有1小时15分钟。 

2017-09-12 11:49:26 7425

原创 python - 动态规划 - 0-1背包问题

动态规划:0-1背包问题,替换问题,解不唯一找到最优子结构和重叠子问题,进而找到状态转移方程最优子结构保证每个状态是最优的;重叠子问题也即n状态的求法和n-1状态的求法是一样的;实现上一般是根据状态转移方程自底向上的迭代求得最优解(也可以使用递归自顶向下求解)。二维数组(状态转移矩阵)dp[i][j]来记录各个子问题的最优状态,其中dp[i][j]表示前i个物体面对容量j背

2017-09-11 18:03:27 1674

原创 python 穷举算法 - 等分8升水问题

改进:1-目前只计算出了一种穷举结果,如何将穷举到的所有结果都计算出来。--------------------穷举算法:当规则制定好后,就需要穷举所有可能.从这些可能中,挑选出最符合的结果。 例:等分8升水问题。建模:假设三个桶大小[8,5,3],给定桶状态[8,0,0],输出桶状态[4,4,0]状态迁移规则:1-一次迁移只能从一个桶A到另一个桶B

2017-09-08 17:16:18 770

原创 python - 穷举所有的数据结构,以及对应的一些实现。还是要多用,熟能生巧 = 技巧多样 + 操作稳定。

问题:想系统的学习python编程。高手的两个标准:1-技巧性比较多样;2-操作性比较稳定。首先想到的是编程都包括些什么。程序 = 数据结构 + 算法。列举出所有的数据结构,学习时能够把握在什么位置。列举出所有的算法,学习时可以触类旁通。理论结合python语言,让其稳稳地落地。解决方案:多学多练。觉得理论单一时,补全理论,使其完整多样。觉得操作不稳时,

2017-09-07 19:50:57 1449

原创 python - 循环队列(数组下标) + 洗牌(随机数且不重复) + 检查数组重复

问题:最近在学习算法方面的东西。目前可能会对算法进行罗列,现罗列 循环队列 和 检查数组重复。洗牌问题是某面试题。解决方案:用计算机求解现实问题,需要解决三个关键问题:计算机求解数学模型的建立人类语言描述的问题数学模型的转换和算法设计---数据结构不仅要能在计算机系统内表达原始问题,还要有利于设计算法。算法设计是对表达在定义好的数据结构上的数据的

2017-09-06 17:25:10 697

原创 python - 采用TDD的方式,实现计算器功能

问题:公司举办了一次TDD的研讨会,讨论的程序为实现计算器的+-*/()。要求采用TDD的方式进行程序的开发,并且程序是稳定的。TDD的例子:str0 = '1 +2 'str4 = '10+22'str5 = '10+22-33'str6 = '10+22-33*44+55 /66 'str1 = '1+(2-3)*4/5'str2 = '10+((20-3

2017-09-05 18:46:36 991

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除