谷歌Gemini 1.5 Pro向所有人开放,无需waitlist!阿里通义千问升级1000万字长文档处理功能!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

现在的AI领域真的是太了!就在前几天,Kimi Chat开启200万字上下文的内测,我写了一篇文章来介绍:卷起来!Kimi Chat开启200万字上下文内测!苹果与谷歌商谈在新iPhone中使用Gemini AI!

今天(3月22日),谷歌Gemini 1.5 Pro向所有人开放,不需要再排waitlist。同样是今天,阿里通义千问宣布升级,向所有用户免费开放1000万字的长文档处理功能。也同样是今天,据知情人士表示,百度文心一言下个月将进行版本升级,届时将开放200万-500万长度的长文本处理能力。目前,文心一言的文本长度上限大致在2.8万字。

谷歌Gemini 1.5 Pro免费开放

谷歌Gemini 1.5 Pro是谷歌在今年2月15日推出的一款100万token上下文长度的LLM,100万token是当时最长的上下文窗口。在国外的LLM中,具有100万token能力的LLM包括Gemini 1.5 Pro和Claude 3。其中Claude 3需要联系Claude官方进行定制才能够体验100万token上下文。作为对比,GPT-4的最新模型上下文窗口是128K。

Gemini 1.5 Pro体验地址:https://aistudio.google.com

更多关于Gemini 1.5 Pro的介绍和初步测试也可以看我之前的文章:

  1. 【全网首发】上周申请的谷歌Gemini 1.5 Pro已通过!百万token的Gemini 1.5 Pro开箱测试(一)

  2. 重磅更新!谷歌发布Gemini 1.5 Pro!多模态,1000K上下文!附Waitlist链接!

如何体验Gemini 1.5 Pro

注意,由于谷歌并不在中国地区开放服务,所以需要能够登录谷歌的特殊工具才能使用Gemini 1.5 Pro,最好是美国IP。

  1. 打开上面Gemini 1.5 Pro的体验地址,用谷歌账号登录。

  2. 选择Use Google AI Studio,注意,这一步不能选错,因为Gemini 1.5 Pro仅开放了通过Google AI Studio使用的窗口,并未开放API使用。

  1. 勾选各项使用规范,然后点击Continue

  1. 到这一步,就大功告成了!Gemini 1.5 Pro支持文本、图片、视频等多模态输入,目前体验下来还是非常香的。

阿里通义千问升级1000万字长文档处理功能

谷歌Gemini 1.5 Pro有一定的使用门槛,Kimi Chat的200万上下文需要排队,目前我们国内用户能直接上手的就是阿里通义千问了!3月22日,阿里通义千问宣布升级,向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。

长文档处理是大模型的一个重要能力,对于大模型理解信息的深度和广度有重要意义。阿里方面称,即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

比如在金融领域,上传一份公司财报,通义千问即可自动提取和总结公司各业务的营收情况和利润增长等核心信息,生成公司整体业绩表现的总结。上传公司不同时期的财报后,通义千问可生成公司在这一阶段内的业务变化、业绩趋势并进行财报分析。在法律领域,律师和法官通常需要阅读数十万甚至上百万字的法律文档,人肉阅读耗时耗力,通义千问能够快速阅读和分析法律文件,迅速掌握法律条文要点,输入特定案件信息后,通义千问还可给出相应的判罚建议。

通义千问目前支持一次性上传100个文件,每个文件的大小上限为150MB,支持的文件格式包括PDF、Word、Excel、Markdown、EPUB、Mobi和txt。

通义千问体验地址:https://tongyi.aliyun.com/qianwen/

关于通义千问的介绍和测评,可以看我之前的文章:

  1. 盘点那些免费的AI对话工具(国内篇):国内TOP3 AI聊天机器人产品介绍

  2. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(一)

  3. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(二)

总结

有条件的小伙伴建议直接体验Gemini 1.5 Pro,它的100万token上下文以及多模态输入(包括视频)体验是非常好的,至少目前能支持视频输入来直接处理和分析的LLM,仅此一家,ChatGPT不可以,Claude 3也不可以。

嫌麻烦的朋友也可以直接在阿里通义千问上体验长文本处理功能,如果阿里说的1000万的窗口是真实的,那么它必将会是目前全世界上下文窗口最长的LLM,没有之一。并且通义千问的综合表现目前是国内的LLM中也是TOP级别的,我个人强烈推荐使用。详细的测评可以看我上面列举的之前的一些文章。


精选推荐

  1. 完全免费白嫖GPT4的三个方法,都给你整理好了!

  2. AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!

  3. Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!

  4. 我用AI工具5分钟制作一个动画微电影!这个AI现在免费!

  5. 当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!

  6. 文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?

  7. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  8. 字节推出了“扣子”,国内版的Coze,但是我不推荐你用!

  9. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  10. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

### 关于Gemini 1.5 Flash的技术文档下载、配置与使用教程 目前关于Gemini 1.5 Flash的具体技术文档尚未公开全面的独立章节,但可以通过以下方式获取相关资源并完成配置: #### 1. **API_KEY申请流程** 为了使用Gemini的相关功能,需先通过官方渠道申请API_KEY。此过程通常涉及注册开发者账号、填写项目需求描述以及审核阶段[^1]。 #### 2. **图像标注能力集成** 对于图像识别和标注的需求,Gemini 1.5 Flash可与其他工具如Cloud Vision或Amazon Rekognition协同工作。具体实现方法包括调用其预训练模型接口,提供图片URL或二进制数据流作为输入参数,并接收返回的结果集用于进一步处理[^2]。 以下是简单的Python代码示例展示如何利用这些服务进行基本操作: ```python import requests def get_image_labels(api_key, image_url): url = "https://vision.googleapis.com/v1/images:annotate?key=" + api_key payload = { "requests": [ { "image": {"source": {"imageUri": image_url}}, "features": [{"type": "LABEL_DETECTION", "maxResults": 10}] } ] } response = requests.post(url, json=payload) return response.json() api_key = 'your_api_key_here' image_url = 'http://example.com/path/to/image.jpg' labels = get_image_labels(api_key, image_url) print(labels) ``` #### 3. **多语言支持与语义理解** 得益于Google Gemini的强大性能,在自然语言处理领域展现了卓越的表现力。无论是跨文化交流还是复杂场景下的意图捕捉均能胜任[^3]。 #### 4. **构建推荐系统案例分享** 当考虑将Gemini应用于实际业务逻辑时,比如商品个性化推送,则可能涉及到检索增强生成(Retrieval-Augmented Generation,RAG)架构的设计思路探讨。这里提到的一篇对比分析文章深入剖析了不同框架之间的优劣差异[^4]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值