- 博客(43)
- 收藏
- 关注
原创 练习
import pandas as pdimport numpy as npdf1 = pd.read_csv(‘zongzi.csv’)请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值print(df1.info())去掉空格df1.columns = df1.columns.str.strip()去掉发货地址的缺失值df1.dropna(axis=0, subset=[‘发货地址’], inplace=True)去掉发货地址的缺失值df1.dropna(axis=0, su
2020-07-01 22:12:56 175
原创 方差
方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。...
2020-06-30 21:54:59 1041
原创 文本数据
第7章文本数据一、string类型的性质1.string与object的区别1 字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随缺失值的存在而改变返回类型(理解:其实还是之前讨论的那个问题,object类型的数据返回值类型会发生变化,而string则不会发生变化,但是据我现在的了解,Nullable中默认的好像只有Int类型 boolean类型 以及string类型 当这些类型数据值发生变动时 数据类型不会发
2020-06-26 15:22:36 579
原创 概率统计第五章第六章打卡
五 常见分布与假设检验5.1 一般随机变量主要分为离散和连续5.1.2 离散型随机变量分布律描述:概率质量函数(PMF)应用: 泊松分布 二项式分布5.1.3 连续型随机变量分布情况描述:概率密度函数(PDF)连续性随机变量在连续点概率取值为0应用: 均匀分布 正态分布 指数分布累积分布函数(CDF)∫PDF=cdf\int PDF = cdf∫PDF=cdf5.2 常见分布5.2.1 离散分布5.2.1.1 二项式分布理解:类似于伯努利分布5.2.1.2
2020-06-26 15:21:31 393
原创 数理统计打卡训练
第三章 数理统计基本概念在统计学中我们需要研究的对象叫做总体,而组成总体的元素叫做个体,从总体中挑选出X1 X2 X3............ XnX_1\ X_2\ X_3 ............\ X_nX1 X2 X3............ Xn这样我们管这个叫做样本 由于抽取数量为n 所以容量为n样本抽取带有随机性,因此是随机分布,样本的性质与总体分布和抽取的样本分布有关其中上述X最对应的x称为观测值统计量与抽样统
2020-06-23 09:41:03 1138
原创 PANDAS缺失数据打卡练习1
1 数据读取由于我上没学,所以上下我是对照来学的,这里笔记注重于语句理解import pandas as pdimport numpy as npdf = pd.read_csv('E:/data/table_missing.csv')df.head(15)read_csv:此句的意思是读取csv格式的表格,pandas中的调用命令为a = pd.read_csv('E:/文件名/文件名')接下来就是pandas中的head命令head:该命令代表的是显示读取文件中的内容,并且显示文
2020-06-22 17:43:18 1218
原创 概率统计第一章打卡学习
随机事件1.1 基本概念随机现象对事件得结果不能完全预测得现象,称之为随机现象随机试验观察随机现象实现得过程,称为随机试验。记为E条件:1 可以在相同条件下重复进行2 结果有多种可能性,并且所有可能的结果事先已知3 作一次试验究竟哪个结果出现,事先不能确定**样本空间**包含随机实验中所有可能的集合为样本空间,记为 Ω\OmegaΩ样本点实验的每一可能结果称为样本点,记为 ω\omegaω随机事件在样本空间中满足一定条件的子集为随机事件,用大写字母 A,B,Bnote:
2020-06-21 10:58:26 778
原创 4打卡
模型融合:对调参完成的模型进行融合,一般在整个过程的后期进行,基于多个比较好的模型,融合后才有好的效果。方法:简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);权重的差异不要太大分类模型:投票(Voting),分为硬投票和软投票,原理是少数服从多数。硬投票:对多个模型直接进行投票,不区分模型结果的相对重要度,最...
2020-04-04 20:00:59 120
原创 3打卡
ask04_建模调参(ing)https://tianchi.aliyun.com/notebook-ai/detail?postId=954604.1 目标掌握常用机器模型的建模与调参流程4.2 内容准备4.2.1 线性回归模型:https://zhuanlan.zhihu.com/p/49480391线性回归对于特征的要求;处理长尾分布;理解线性回归模型;4.2.2 模型性...
2020-04-01 17:17:57 171
原创 通配符匹配
1.遇到s和p都是""则直接返回true2.判断边界条件如果s串已经遍历完毕,则判断p串是否便利完毕,如果p串长度大于s串,则判断大于部分是否都是*,如果是则返回true,否则返回false3.判断边界条件如果p串已经便利完毕,则判断s串是否便利完毕,是则返回true,否则返回false4.判断字符是否相等5.如果p串当前字符是则有两种可能,第一种是忽略继续匹配,第二种是,继续匹配s剩余字...
2020-03-30 21:23:00 121
原创 加油站
class Solution {public: int canCompleteCircuit(vector<int>& gas, vector<int>& cost) { int n = gas.size(); int res = -1; for(int i = 0; i < n; ++i) {...
2020-03-29 19:17:41 198
转载 跳跃游戏
设定循环不变式为 “maxJump 表明最大能跳到的距离”1.如果i不在maxJump 的范围内,表明当前无法跳到2.如果在maxJump范围内,计算当前所能跳跃到的距离和maxJump比较,替换成更大的3.循环结尾看maxJump是否超过数据长度PS:因为数组内是上限,所以用一个数字就可以,如果是能够跳的补数,那么使用一个数组class Solution {public:bool ...
2020-03-28 16:48:12 114
原创 数据挖掘特征工程
3.1 特征工程目标对于特征进行进一步分析,并对于数据进行处理完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。3.2 内容介绍常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采...
2020-03-28 16:41:56 217
原创 分配饼干
class Solution {public: int findContentChildren(vector<int>& g, vector<int>& s) { if(s.empty() || g.empty()) return 0; sort(g.begin(), g.end()); sort(s...
2020-03-27 22:38:38 163
原创 判断子序列
class Solution {public:bool isSubsequence(string s, string t) {int i = 0, j = 0;int m = s.size(), n = t.size();while(i < m && j < n){if(s[i] == t[j]){i++;j++;}else j++;}retur...
2020-03-26 20:17:22 112
原创 买股票的最佳时机
class Solution { public int maxProfit(int[] prices) { return calculate(prices, 0); } public int calculate(int prices[], int s) { if (s >= prices.length) ret...
2020-03-25 20:10:23 70
转载 二叉树恢复
中序遍历class Solution: def recoverTree(self, root): """ :type root: TreeNode :rtype: void Do not return anything, modify root in-place instead. """ # predeces...
2020-03-24 20:41:08 125
原创 EDA
EDA数据探索分析学习历程在这里我们用到了python中的几个库,这几个库分别是 pandas numpy matplotlib.pyplot seaborn missingnopandas是基于NumPy的一种工具,该工具是为了解决数据分析任务二创建的,Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需要的工具。pandas提供了大量能使我们快速便捷地处理数...
2020-03-24 14:39:13 374
原创 二叉树
class Solution { public LinkedList<TreeNode> generate_trees(int start, int end) { LinkedList<TreeNode> all_trees = new LinkedList<TreeNode>(); if (start > end) { a...
2020-03-23 22:21:18 60
原创 二叉树中的序遍历
class Solution { public List < Integer > inorderTraversal(TreeNode root) { List < Integer > res = new ArrayList < > (); TreeNode curr = root; TreeNode pre...
2020-03-22 21:26:27 197
原创 二叉树的最大深度
刚开始拿到这道题的时候我就想可以使用遍历的方法访问每个节点,后来从leetcode上获得可以使用迭代的方法,通过更新栈的方法逐步更新栈中的数据,每次获得一个新的数据 就将原来 的 数据弹出,这里 我采用java实现import javafx.util.Pair;import java.lang.Math;class Solution { public int maxDepth(Tree...
2020-03-21 20:15:54 78
原创 对称的树
public boolean isSymmetric(TreeNode root) { return isMirror(root, root);}public boolean isMirror(TreeNode t1, TreeNode t2) { if (t1 == null && t2 == null) return true; if (t1 ==...
2020-03-20 19:05:18 129
原创 相同的树
class Solution: def isSameTree(self, p, q): """ :type p: TreeNode :type q: TreeNode :rtype: bool """ # p and q are both None if not p an...
2020-03-19 19:58:54 59
原创 正则
enum Result { TRUE, FALSE}class Solution { Result[][] memo; public boolean isMatch(String text, String pattern) { memo = new Result[text.length() + 1][pattern.length() + 1]; ...
2020-03-18 21:27:39 85
原创 最长回文子串
public String longestPalindrome(String s) { if (s == null || s.length() < 1) return ""; int start = 0, end = 0; for (int i = 0; i < s.length(); i++) { int len1 = expandAround...
2020-03-17 21:12:51 59
原创 无重复字符的子串
public class Solution { public int lengthOfLongestSubstring(String s) { int n = s.length(); int ans = 0; for (int i = 0; i < n; i++) for (int j = i + 1; j &l...
2020-03-16 21:29:07 155
原创 有效的括号
class Solution { // Hash table that takes care of the mappings. private HashMap<Character, Character> mappings; // Initialize hash map with mappings. This simply makes the code easier to...
2020-03-15 19:38:37 76
原创 最长公前缀
public String longestCommonPrefix(String[] strs) { if (strs.length == 0) return ""; String prefix = strs[0]; for (int i = 1; i < strs.length; i++) while (strs[i].indexOf(prefix) != ...
2020-03-14 20:56:28 133
原创 罗马数字转整数
class Solution {public: int romanToInt(string s) { unordered_map<string, int> m = {{"I", 1}, {"IV", 3}, {"IX", 8}, {"V", 5}, {"X", 10}, {"XL", 30}, {"XC", 80}, {"L", 50}, {"C", 100}...
2020-03-13 22:13:13 69
原创 合并K个排序链表
from Queue import PriorityQueueclass Solution(object): def mergeKLists(self, lists): """ :type lists: List[ListNode] :rtype: ListNode """ head = point = L...
2020-03-12 19:31:22 49
原创 两数相加
1 首先两个链表相加 要考虑一种情况 位数是否一致,如果一个为923 一个为63则在63前面补零即923+0632 在两数相加时要考虑上一位的进位和本位的加法3 如果最后的进位为1要在节点前加一JAVA实现:/** * Definition for singly-linked list. * public class ListNode { * int val; * ...
2020-03-11 01:41:30 143
原创 删除的链表的倒数的第N个节点
这道题可以定义两个指针,一个指针,一个指针从开头出发移动N+1个节点 ,第二个质争从头开始,与第二个指针保持N的距离,当第一个指针到达最后一个节点的时候,第二个指针正好到达倒数第N个节点,删除该节点的数,再将第二个指针重新连接到下下个节点,完成题目要求JAVA实现public ListNode removeNthFromEnd(ListNode head, int n) { ListN...
2020-03-11 01:16:49 83
原创 环形链表
给定一个链表,判断链表中是否有环。为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有环。public boolean hasCycle(ListNode head) { if (head == null || head.next == null) { return false; ...
2020-03-09 20:20:30 80
原创 删除链表中重复元素
给定一个排序链表,删除所有重复的元素,使得每个元素只出现一次。/** * Definition for singly-linked list. * struct ListNode { * int val; * ListNode *next; * ListNode(int x) : val(x), next(NULL) {} * }; */class Sol...
2020-03-08 20:43:03 699
原创 链表
合并两个有序链表题目:将两个有序链表合并为一个新的有序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。class Solution {public: ListNode* mergeTwoLists(ListNode* l1, ListNode* l2) { //很巧妙地引入一个特殊结点preHead ListNode* preHead ...
2020-03-07 21:06:25 118
原创 买股票的最佳时机
买股票的最佳时机给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易class Solution { public int maxProfit(int[] prices) { if (prices.length == 0) { return 0; } ...
2020-03-06 19:04:41 84
原创 最接近的三数之和
最接近的三数之和问题描述,给定一个包括 n 个整数的数组 nums 和 一个目标值 target。找出 nums 中的三个整数,使得它们的和与 target 最接近。返回这三个数的和。假定每组输入只存在唯一答案。首先针对这道题最好不要使用遍历的算法,所以在这里有下面这个解题思路(1)首先对整个数组进行排序,从小到大排序(2)定义两个指针,类似于三数之和的思路,其中一个指针指的是数组的前端,...
2020-03-05 19:57:28 72
原创 三数之和
三数之和问题:给定一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?找出所有满足条件且不重复的三元组。解决这道题我们使用了三指针的思路(1)对给定数组重新排序,默认从小到大,定义一个三指针 变量为i j k k指向数组的末尾 j指向数组的第二个变量(2)当第重排数组第一项大于1或者数组长度小于2退出(3)检测三个指...
2020-03-04 20:46:16 140
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人