爬取了1W个字节跳动岗位信息,我发现了什么?

前言

过了春节,春招应该就正式开始了,很多小伙伴应该已经提前准备起来了。最近在家闲来无事,突发奇想自己想看看字节跳动的岗位需求,毕竟字节这两年发展的势头确实非常猛,不少小伙伴都想加入。

正文

字节跳动公开的岗位信息都发布在自己的官网上,页面上显示有 1W+ 的岗位,看来发展确实好需求量这么大。

但是这样看起来肯定非常辛苦,所以我就写了一个脚本抓取了上面的数据。代码就不展示了,一共 100 多行,有兴趣的同学可以后台回复关键字【字节】自己拿源码跑一下。

爬取到的数据我保存到了一个 CSV 文件中,成功抓到了 1W 条数据左右。

里面有每个岗位的介绍、要求、工作地点等等,我就继续对现在这些数据进一步处理一下。

第一张图是字节岗位的分布,说实话第一次看到这张表的时候我还是蛮惊讶的。我印象里,字节是一个非常前卫互联网公司,号称 APP 工厂。所以我以为对研发的需求会比较高,但是从表里我们可以看到研发和运营基本上是五五开了。也是侧面说明,字节也开始慢慢进入到一个平稳期。

比如号称日活六亿的抖音,已经是个很成熟的产品了,并不需要再迭代太多的功能。但是需要更多的运营人员来做活动,丰富整一个生态。

另外一点就是一万个岗位,只有 69 个是游戏策划,看来字节还没有进入到游戏领域,不像腾讯和阿里。

第二张图是岗位城市的分布。不出所料,北京作为字节的大本营,遥遥领先于其他的城市。

值得注意的是,新加坡、山景城、都柏林加在一起有六百人的样子。应该主要是 tiktok 的团队,tiktok 这些年确实风靡全球,我印象中应该是第一个国内 APP 成功地走向了世界。

有些小伙伴如果觉得北上广深这样的一线城市物价房价比较高,其实成都武汉这样的二线城市也不错,提供了一定的岗位。

第三图是北京市的岗位分布。和第一张图比较类似,研发、运营和产品岗的需求量很大,其他岗位面临着比较大的竞争压力。

第四张图是上海岗位和整个字节岗位的对比。占比确实还是比较小,比如像职能岗位一共只有五个

最后我把岗位的介绍和需求做了分词,做了一张词云表。主要就是负责、技术、产品、开发、业务、平台、团队等。都是一些耳熟能详的套话了,可能大家的 JD 都是互相抄

特别推荐一个分享架构+算法的优质内容,还没关注的小伙伴,可以长按关注一下:



长按订阅更多精彩▼

如有收获,点个在看,诚挚感谢
在Python中爬取字节跳动(Bytedance)的内容,比如抖音或TikTok,通常会涉及到网络请求和数据解析,因为字节跳动的网站和应用通常有反爬虫机制。以下是一个简化的步骤概述: 1. **安装所需库**:首先,你需要安装一些Python库如`requests`用于发送HTTP请求,`beautifulsoup4`或`lxml`用于HTML解析。 ```bash pip install requests beautifulsoup4 ``` 2. **模拟用户访问**:由于反爬虫策略,你可能需要设置User-Agent头和添加延迟以避免被识别为机器人。例如,使用`fake_useragent`库可以随机更换User-Agent。 ```python from fake_useragent import UserAgent ua = UserAgent() headers = {'User-Agent': ua.random} ``` 3. **发送请求**:使用`requests.get`获取网页内容,并指定合适的URL和 headers。 ```python import requests url = 'https://www.tiktok.com/' # 示例URL response = requests.get(url, headers=headers) ``` 4. **解析HTML**:使用BeautifulSoup解析返回的HTML内容,找到需要的数据元素,这通常涉及CSS选择器或XPath。 ```python from bs4 import BeautifulSoup soup = BeautifulSoup(response.text, 'lxml') data_elements = soup.select('your_css_or_xpath_selector') # 替换为实际元素选择 ``` 5. **数据提取**:遍历解析后的数据,提取你需要的信息,存储到文件、数据库或其他地方。 6. **处理异常**:记得捕获可能出现的网络错误或解析错误,并适当地处理它们。 7. **遵守法规和政策**:在爬取数据之前,务必了解并尊重字节跳动的服务条款,特别是对于抓取用户生成内容的要求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值