2024年最新nodejs 爬取前端面经并生成词云(1),字节跳动客服面试经验

最后

中年危机是真实存在的,即便有技术傍身,还是难免对自己的生存能力产生质疑和焦虑,这些年职业发展,一直在寻求消除焦虑的依靠。

  • 技术要深入到什么程度?

  • 做久了技术总要转型管理?

  • 我能做什么,我想做什么?

  • 一技之长,就是深耕你的专业技能,你的专业技术。(重点)

  • 独立做事,当你的一技之长达到一定深度的时候,需要开始思考如何独立做事。(创业)

  • 拥有事业,选择一份使命,带领团队实现它。(创业)

一技之长分五个层次

  • 栈内技术 - 是指你的前端专业领域技术

  • 栈外技术 - 是指栈内技术的上下游,领域外的相关专业知识

  • 工程经验 - 是建设专业技术体系的“解决方案”

  • 带人做事 - 是对团队协作能力的要求

  • 业界发声 - 工作经验总结对外分享,与他人交流

永远不要放弃一技之长,它值得你长期信仰持有

开源分享:【大厂前端面试题解析+核心总结学习笔记+真实项目实战+最新讲解视频】

主要内容包括html,css,html5,css3,JavaScript,正则表达式,函数,BOM,DOM,jQuery,AJAX,vue 等等。

console.log(err);

}

});

});

}

但是这样有一个问题,因为他是根据词频选取的,所以有一些没用的词比如面试官,一面等词语就会混入到我们的词中,所以我们需要将有用的信息过滤出来

const tagList = [‘原型’, ‘闭包’, ‘HTTP’, ‘CORP’, ‘TCP’, ‘https’,‘跨域’,‘XSS’,‘安全’,‘事件’,‘VUE’,‘CSS’,‘算法’,‘线程’,‘NODE’];

let textNo = JSON.stringify(result.filter(item => tagList.indexOf(item.word.toUpperCase()) >= 0));

生成数据如下

这里写图片描述

和我想象的还是有些差距的,可能程序并不是太完善,然后就可以把数据导入到任何一个在线词云里面了

完整代码

const https=require(‘https’);

const fs=require(‘fs’);

const request=require(‘request’);

const async=require(‘async’);

const cheerio = require(‘cheerio’);

const nodejieba = require(‘nodejieba’);

const startPage =0;//开始页

const endPage = 4;//结束页

const keyWord = “”;//关键词

const keyWord2 = “前端”;

let page=startPage;

let i=0;

//初始url

const url={

hostname: ‘www.nowcoder.com’,

path: ‘/discuss?type=2&order=’ + startPage,

headers: {

‘Content-Type’: ‘text/html’,

‘User-Agent’: ‘Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36’,

}

}

let urlList=[];//存储图片页面地址

//获取图片所在页面

function getUrl(url){

//采用http模块向服务器发起一次get请求

https.get(url,function(res){

var html=‘’;

//res.setEncoding(‘binary’);

//监听data事件,每次取一块数据

res.on(‘data’,function(chunk){

html+=chunk;

});

res.on(‘end’,function(){

var $ = cheerio.load(html); //采用cheerio模块解析html

$(‘li .discuss-main.clearfix’).each(function(){

var title=$(this).children().first().text();

if(title.indexOf(keyWord2)>=0){

var search=$(this).children().first().attr(‘href’);

//console.log(search);

let nextLink = “https://www.nowcoder.com” + search;

urlList.push(nextLink);

}

})

page++;

if(page<=endPage){

let tempUrl=‘https://www.nowcoder.com/discuss?type=2&order=’ + page;

getUrl(tempUrl);

}else{

fetchPage();

}

})

}).on(‘err’,function(err){

console.log(err);

})

}

function fetchPage(){

//异步控制并发

async.mapLimit(urlList,5,function(url,callback){

https.get(url,function(res){

//console.log(url);

let html=‘’;

//res.setEncoding(‘binary’);

res.on(‘data’,function(chunk){

html+=chunk;

})

res.on(‘end’,function(){

//console.log(html);

var $ = cheerio.load(html); //采用cheerio模块解析html

var content = $(‘.post-topic-des’).text().trim();

//console.log(content);

appendText(content);

})

}).on(‘err’,function(err){

console.log(err);

});

callback(null,‘成功’);

},

function(err,result){

if (err){

console.log(err)

}

else{

console.log(‘结束’);

wordCluod();

}

})

}

function appendText(text){

fs.appendFile(‘./data/word.txt’, text, ‘utf-8’, function (err) {

if (err) {

console.log(err);

}

});

}

// 生成词云数据

function wordCluod(){

fs.readFile(‘./data/word.txt’, ‘utf8’, function(err, data){

nodejieba.load({

userDict: ‘./user.utf8’,

});

const result = nodejieba.extract(data, 120);

const tagList = [‘原型’, ‘闭包’, ‘HTTP’, ‘CORP’, ‘TCP’, ‘HTTPS’,‘跨域’,‘XSS’,‘安全’,‘事件循环’,‘VUE’,‘CSS’,‘算法’,‘线程’,‘NODE’,‘’,‘缓存’,‘内存’,‘作用域链’,‘垂直居中’,‘布局’,‘状态码’,‘原型链’,‘ES6’,‘箭头函数’,“PROMISE”,‘垃圾回收’,‘优化’];

let textNo = JSON.stringify(result.filter(item => tagList.indexOf(item.word.toUpperCase()) >= 0));

let text = JSON.parse(textNo);

let temp = “”;

for(let i in text){

temp += text[i].word + " " + Math.ceil(text[i].weight) + “\n”;

}

fs.writeFile(‘./data/’+‘wordCloud’+‘.txt’,temp, ‘utf-8’, function (err) {

if (err) {

console.log(err);

自学几个月前端,为什么感觉什么都没学到??


这种现象在很多的初学者和自学前端的同学中是比较的常见的。

因为自学走的弯路是比较的多的,会踩很多的坑,学习的过程中是比较的迷茫的。

最重要的是,在学习的过程中,不知道每个部分该学哪些知识点,学到什么程度才算好,学了能做什么。

很多自学的朋友往往都是自己去找资料学习的,资料上有的或许就学到了,资料上没有的或许就没有学到。

这就会给人一个错误的信息就是,我把资料上的学完了,估计也-就差不多的了。

但是真的是这样的吗?非也,因为很多人找的资料就是很基础的。学完了也就是掌握一点基础的东西。分享给你一份前端分析路线,你可以参考。

开源分享:【大厂前端面试题解析+核心总结学习笔记+真实项目实战+最新讲解视频】

还有很多的同学在学习的过程中一味的追求学的速度,很快速的刷视频,写了后面忘了前面,最后什么都没有学到,什么都知道,但是什么都不懂,要具体说,也说不出个所以然。

所以学习编程一定要注重实践操作,练习敲代码的时间一定要多余看视频的时间。

  • 7
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值