- 博客(265)
- 资源 (15)
- 收藏
- 关注
原创 Python实现批量导入Markdown文件到WordPress(博客搬家工具,代码已开源)
本文同步发布于我的个人网站:https://jwblog.xyz代码已开源:https://github.com/nefu-ljw/python-markdown-to-wordpress1. 熟悉安装和使用python-wordpress-xmlrpcpython-wordpress-xmlrpc,这个其实就是别人写好的包,直接调用了 WordPress 的 xmlrpc 接口发布文章。首先安装这个包,对于python3,用 pip3 install python-wordpress-xmlrpc
2021-11-21 18:12:15 1636
原创 2021 从零开始学Git【新版本Git - 8000字详细介绍】
我写的这篇文章,主要是记录自己的学习过程,也希望帮助读者少踩坑(比如不同版本可能命令不兼容等)。本文面向git零基础初学者,建议读者按照文中命令自己全部操作一遍(注意运行环境)。我的运行环境:win10 + VMware + ubuntu 18.04 + git 2.33.0(所有命令均在root用户下执行)本文参考资料:[1] 廖雪峰 Git教程[2] 博客园 一个小时学会Git[3] Git中文官方文档资料在精不在多,以上3个资料足以详细解释git的各项命令,建议把这些资料都看一下。从时效性
2021-10-24 20:51:56 1102
原创 2021年计算机保研经历:人大信院、南大软院、华师数据院、厦大软件、湖大信院【7000字详细介绍】
今年准备保研期间,我在网上看了许多保研经验贴,受益匪浅。如今尘埃落定,那么我也将自身经历详细写出,希望对学弟学妹们能有所帮助。(如果觉得有用就点个赞吧~)文章目录科普个人背景夏令营情况1. 中国人民大学 信息学院 专硕2. 湖南大学 信息科学与工程学院 学硕3. 厦门大学 信息学院软件工程系 专硕4. 华东师范大学 数据科学与工程学院 专硕5. 南京大学 软件学院 专硕预推免情况Ending
2021-09-25 21:51:36 13858 23
原创 解决Ubuntu20.04启动MySQL报错(Job for mysql.service failed because the control process exited with error)
mysql启动时报错情况sudo service mysql start # 启动Job for mysql.service failed because the control process exited with error code.See “systemctl status mysql.service” and “journalctl -xe” for details.
2024-02-28 14:33:33 6064 1
原创 基于Flink CDC实时同步PostgreSQL与Tidb【Flink SQL Client模式下亲测可行,详细教程】
只要这个flink作业是正常runnning,那么对source_table的任何修改都会同步到sink_table。注意这种是单向同步,source_table的变动(增/删/改)会同步到sink_table,但反过来sink_table的变动不会影响到source_table(不会触发source_table->sink_table的同步)。
2023-08-20 20:38:30 2730
原创 wsl1 ubuntu通过宿主机代理连接外网
背景:公司电脑是局域网,通过走代理来连接外网wsl1 ubuntu想要通过来连接宿主机的局域网代理,访问外网可以先在ubuntu上测试下走代理的网络,注意不能用ping(ping不走代理),可用curl测试。
2023-08-11 15:56:17 2476
原创 git通过ssh代理连接github(gitee不支持),并更改端口
Hostname ssh.github.com和ProxyCommand nc -X connect -x 127.0.0.1:3128 %h %p 定义对服务器 github.com 的 ssh 调用应该重新路由到端口 3128 上的代理服务器 127.0.0.1,并且服务器不应该是 github.com 而是更改为ssh.github.com。这是 github 允许使用 git 或 ssh 协议通过 https(端口 443)连接到服务器(That is the server where github
2023-06-20 17:56:17 3499
原创 银行从业资格证(初级) 5天零基础拿证攻略【个人经历,亲测】
教材可买可不买,时间不够可以不看教材。可以买天一金融的真题汇编,它附赠一个考点整理的小册子。一定要自己整理知识框架。看个人习惯选择网上做真题卷还是买纸质版的真题。我是直接在233网校上做真题,做完之后把错题整理到文档里,这时可以自把多个不同错题合并到同一个知识点,举个例子,一/二/三版巴塞尔协定的内容和改进、信用证与备用信用证、抵押权与质权等等。做了几套真题就知道有些知识点是会重复考的,虽然题可能表面上不一样,但是知识点都大差不差。
2023-06-03 21:36:46 1269 1
原创 SQL笔试题 分组计算比例+保留小数不够补0+连接字符串【cast、round、decimal、concat函数】
要求分组计算每个pay_ability中违期还款的比例(overdue_days不为空);大致思路就是两表连接,分组,然后比较麻烦的是算比例。最初始计算方法是`count(overdue_days)/count(*)`,分子选出overdue_days不为空的行,分母选出所有的行。然后还需要各种细节处理,比如...
2023-04-11 11:25:54 706 1
原创 力扣 每日一题 1017. 负二进制转换【难度:中等,rating: 1697】(负二进制)
类似十进制转二进制%2,改成%(-2),可能的余数为0,1,-1。想办法把-1给转换掉:就是余数-1变成+1,然后商+1
2023-04-06 12:35:20 459
原创 windows11 conda 创建/删除/查看环境命令 + 换源 + 换环境安装路径
如果没有sudo权限,创建虚拟环境,就还是会装到C盘用户目录,显然这就是权限问题!env子目录右键-属性-安全-Users修改权限-完全控制(全部打勾)。即可让非sudo权限的用户写入。看来windows修改父目录的权限并不会递归修改子目录的权限。
2023-03-28 20:52:17 2270 1
原创 【2023最新】Windows11 wsl2 ubuntu22.04安装与配置
(1)这行命令之后安装的所有 Linux 发行版都默认 WSL2 执行。(2)`wsl --list --online` 以查看可用发行版列表并运行 `wsl --install -d ` 以安装发行版。 (3)设置进入ubuntu的默认用户(4)从主机win11拷贝文件
2023-03-24 16:14:03 8866 3
原创 力扣 每日一题 1326. 灌溉花园的最少水龙头数目【难度:困难,rating: 1885】(动态规划)
得到所有区间,按左端点L、右端点R进行排序。然后遍历这些区间覆盖的每个点i,保证L
2023-02-21 15:40:27 218
原创 力扣 每日一题 1250. 检查「好数组」【难度:困难,rating: 1983】(数论)
这题关键在于发现最大公因数(gcd)起到的作用,将原问题转换为“判断是否存在多个数,它们的gcd=1”。更形式化的定理称为“裴蜀定理”
2023-02-15 19:43:43 166
原创 spark 内存管理机制与相关参数调优
执行内存是指用于洗牌(shuffle)、连接、排序和聚合中的计算,而存储内存是指用于在集群中缓存和传播内部数据的内存。在 Spark 中,执行和存储共享一个统一的区域(M)。spark 可以通过jdbc操作关系数据库,但是若是没有分散数据的依据,则将所有数据都读到driver节点上时,这时,强烈建议先看一下表的数据量和集群中对spark的内存设置参数。Spark 1.6 之后引入的统一内存管理机制,与静态内存管理的区别在于存储内存和执行内存共享同一块空间,可以动态占用对方的空闲区域。
2023-02-03 15:59:15 790
原创 scala 集合总结(Seq、Map、Set、List、Tuple、Option)
从较高的层次来看 Scala 集合,主要有以下三个类别可供选择:Sequences是元素的顺序集合,可以是索引的(如数组)或线性的(如链表);Maps包含键/值对的集合,类似于Java的Map、Python的dict;Sets是唯一元素的无序集合;所有这些都是基本类型,并且具有用于特定目的的子类型,例如并发、缓存和流式处理。除了这三个主要类别之外,还有其他有用的集合类型,包括ranges, stacks, queues。
2023-01-04 14:01:20 1511
原创 spark sql Dataframe 的 union、reduce、reduce(_ union _)
union返回一个新的数据集,其中包含此数据集中的行和另一个数据集中的行的并集。这相当于 SQL 中的 UNION ALL。 要执行 SQL 样式的集合并集(对元素进行重复数据删除),请使用此函数,后跟一个不同的。
2023-01-03 18:04:15 980
原创 scala vararg( * 与 _* 的用法)
:_*作为一个整体,告诉编译器你希望将某个参数当作参数序列处理!例如val s = sum(1 to 5:_*)就是将1 to 5当作参数序列处理。在spark sql Column中isin函数的定义是:def isin(list: Any*): Column。函数外部传入:参数序列;函数内定义:vararg。
2023-01-03 17:17:00 497
原创 spark sql DataFrame 的 groupBy+agg 与 groupByKey+mapGroups
groupBy 对比 groupByKey;groupByKey + mapGroups / groupBy + agg
2023-01-03 17:01:00 1838
原创 从spark WordCount demo中学习算子:map、flatMap、reduceByKey
从spark WordCount demo中学习算子:map、flatMap、reduceByKey;转换与聚合
2023-01-03 16:54:06 517
原创 spark sql - Dataset数据类型
Dataset是特定领域对象的强类型集合,可以使用函数或关系操作并行转换。 每个Dataset还有一个无类型的视图,称为DataFrame,它是一个Dataset of Row。DataFrame = Dataset[Row]。Dataset上可用的操作分为转换(transformation)和操作(action)。 转换是产生新数据集的,动作是触发计算并返回结果的。
2023-01-03 16:51:26 876
原创 力扣 每日一题 862. 和至少为 K 的最短子数组【难度:困难,rating: 2306】(前缀和+单调队列)
可以想办法维护放入队列的下标 i 对应的前缀和 sum[i] 依然单调递增。为了做到这一点,考虑在加入当前下标 i 到队列之前,弹出不影响后续答案的元素。结论:假设 sum[i] 的前面有一些 sum[j] (j < i),满足sum[j]>=sum[i],那么这些 j 被弹出并不会影响答案。
2022-10-27 20:49:34 432
原创 力扣 每日一题 934. 最短的桥【难度:中等,rating: 1825】(dfs / bfs)
题目要求的实际上是两个由1组成的连通块之间的最小距离。那么直接可以想到:把这两个连通块内的所有点分别求出来,然后O(n2)遍历这些点,求它们的最小距离即为答案。两次dfs(深度优先搜索)即可得到两个连通块内的所有点。
2022-10-25 12:25:11 310
原创 力扣 每日一题 1235. 规划兼职工作【难度:困难,rating: 2022】(动态规划+二分查找)
将所有工作按结束时间排序,然后考虑动态规划:1. 直接放弃第 i 个工作,那么保持前 i-1 个工作的收益,dp[i]=dp[i-1]。2. 设法选上第 i 个工作,那么dp[i]=dp[k]+profit[i],其中 k 必须满足 end[k]
2022-10-22 12:14:12 565 2
原创 力扣 每日一题 902. 最大为 N 的数字组合【难度:困难,rating: 1989】(数学 / 数位dp)
设 n 的位数(长度)为 len_n,digits 的长度为 len_d,那么长度小于 len_n 的从 digits 中取出的所有任意组合均满足条件,方案数
2022-10-18 13:20:52 665
原创 力扣 每日一题 886. 可能的二分法【难度:中等,rating: 1794】(并查集 / 拆点优化的扩展域并查集)
文章目录题目链接思路一(建图+并查集)代码一思路二(扩展域并查集)代码二其他解法补充资料:并查集的时间复杂度
2022-10-17 19:59:05 547
原创 力扣 每日一题 768. 最多能完成排序的块 II【难度:困难,rating: 1787】(区间合并+区间计数)
只需合并小区间成大区间,然后统计大区间个数即可。原数组中的每个位置 start_pos,需要进行升序排序得到一个新位置 end_pos。这样能固定一个最小块的区间[min(start_pos,end_pos), max(start_pos,end_pos)],也就是说,至少在这个范围内的数必须划分在同一个块里面,这是必要条件,否则就不满足所有块连接起来之后升序。那么我们可以存储所有最小块的区间,它们之间可能有交集,对于有交集的,就把这些区间并在一起(小的块合并成大的块);
2022-10-13 17:36:35 192
原创 【NLP实践】用预训练的词向量处理词的相似性和类比任务
请事先下载数据集,https://nlp.stanford.edu/projects/glove 下载glove.6B.zip文件并解压。本文使用数据集为glove.6B.50d.txt,其必须保存到项目路径的./data子目录下。以下是跑通glove.6B.50d.txt数据集的python代码(对于书中的原代码有改动,并加上了自己的注释)
2022-10-12 11:18:22 994 1
原创 力扣 每日一题 801. 使序列递增的最小交换次数【难度:困难,rating: 2066】(动态规划)
对于每个位置 i,都有两种可能的操作(交换、不交换)。可以用一个数组记录每个位置 i,在 交换/不交换 操作后满足递增关系时的总操作次数。假设从位置 0 到位置 i 满足递增关系所需总操作次数为dp[i][0](位置 i 不交换),从位置 0 到位置 i 满足递增关系所需总操作次数为dp[i][1](位置 i 交换),考虑其前一个相邻位置 i-1,那么它们满足以下关系:
2022-10-10 20:29:03 429
原创 力扣 第314场周赛 Q3 使用机器人打印字典序最小的字符串【难度:中等,rating: 1953】(栈+贪心)
字符串 t 后进先出,可以看成是一个栈。贪心思想:遍历字符串 s,操作如下:若 当前栈顶
2022-10-10 00:04:31 226
原创 力扣 每日一题 856. 括号的分数【难度:中等,rating: 1562】(栈 / 思维计数&括号深度)
可以发现每次加上的值总是2的幂(幂次设为n,即2^n),那么不妨考虑幂次n与括号的关系:n=左括号的个数−右括号的个数左括号减去右括号的个数其实就是“括号的深度”。只在括号形式为"()"时进行计数,因为这是被包裹在最里面的成对括号,只要记录它的深度并且计数即可
2022-10-09 17:32:51 652
原创 力扣 每日一题 870. 优势洗牌【难度:中等,rating: 1648】(贪心+双指针)
贪心、双指针。贪心策略类似于田忌赛马(大的匹配大的,匹配不上就用小的匹配大的)。首先,肯定要把nums1, nums2排序,对于nums2还要额外记一下排序前的原坐标(可以用pair存到vector里面),存入s2。然后,以下图为例,用双指针i, j比较两个数组尾部的大小,逆序遍历s2,如果nums1>s2,那么直接匹配上;反之,则将s2匹配上nums1的首部,这个首部的坐标可以再加一个指针k来维护。
2022-10-08 11:54:59 262
原创 力扣 每日一题 927. 三等分【难度:困难,rating: 1994】(思维+后缀字符串+bitset技巧)
本题的关键在于发现:1.字符串能被三等分 => 1的总个数必须是3的倍数。必须满足这个必要条件。2.第3个子串的结束位置被固定在串的末尾,那么第3个子串的后缀0的个数suffix_zero_count,能用于限制前面第1、2个子串的后缀0个数。因为第3个子串的后缀0是固定的,而前面的两个子串的后缀0是可以往后调整的,只要它们的后缀0个数>=suffix_zero_count,多余的后缀0就可以划分给下一个子串作为前导0。通过这种调整,确定了第1、2个子串的结束位置,同时也确定了第2、3个子串的开始位置。
2022-10-06 21:06:12 639 1
原创 力扣 每日一题 777. 在LR字符串中交换相邻字符【难度:中等,rating: 1938】(思维)
题意的浅层描述是:start串的XL能被替换为LX,RX能被替换为XR。对于start串的替换操作,稍加扩展可以得到:L能够越过左边的若干个X,但是不能越过L或R。R能够越过右边的若干个X,但是不能越过L或R。例如 start=RXXLRXRXL -> RLXXXXRRL。
2022-10-03 11:20:49 302
原创 剑指 Offer 06. 从尾到头打印链表【难度:简单】(链表翻转)
非常经典的单向链表翻转。思路就是固定原来的头结点init_head,把init_head后面的结点依次移动到链表首部,直到init_head后面没有结点,即init_head变成了链表尾部。
2022-09-30 16:08:22 192
原创 剑指 Offer 04. 二维数组中的查找【难度:中等】(类二叉查找树)
主要有三种思路:1.暴力找,时间复杂度O(n*m)。2.二分找,时间复杂度O(n*logm)。3.看成是二叉排序树的查找,时间复杂度O(n+m)。第三种思路比较巧妙,利用该矩阵的特殊性质(行元素递增、列元素递增),将矩阵看成是二叉排序树,每个元素是树中的一个结点,其左边的元素都比它小,下边的元素都比它大。 右上角的元素看成是根结点。注:二叉查找树 (BST,Binary Search Tree),又称二叉搜索树、二叉排序树。
2022-09-30 00:05:40 575
【机器学习】线性回归(最小二乘法or梯度下降法)、多项式回归、logistic回归、softmax回归.zip
2021-06-10
【机器学习】python构建ID3决策树+pygraphviz可视化(代码详解,附注释)
2021-05-04
Apriori算法代码和原数据集.zip
2020-11-25
https://blog.csdn.net/ljw_study_in_CSDN/article/details/108484853 配套excel原始数据
2020-09-10
计算机组成原理课设:8条指令模型机(logisim文件和主存数据).zip
2020-07-09
计算机组成原理课设:原码一位乘、补码一位乘(logisim文件).circ
2020-07-09
数字逻辑课设:数字时钟(logisim文件).circ
2020-06-24
数字逻辑课设:简易秒表设计(logisim文件).circ
2020-06-24
信息学奥赛课课通(C++)配套资料【完整版】
2019-01-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人