周村信息网是领先的新闻资讯平台,汇集美食文化、生活百科、国际资讯、房产家居、综艺娱乐、体育健康、等多方面权威信息
2023-06-12 18:07:02
文章开始之前先说个冷知识:今年是Google举办I/O开发者大会的第15个年头。
纵观近七年来的I/O大会,AI内容一直是Google的重中之重。例如在ChatGPT爆火之前,Google就已经在I/O大会上展示过LaMDA系列语言生成模型,只是一直没等到大火的机会。
如今,ChatGPT的爆发让AI来到了最好的时刻,但也让Google感到无比焦虑。
看完整场大会,Google共提及「AI」一词近200次,几乎把AI写进了包括Gmail、搜索、Pixel等所有产品里面,迫切地想向所有人证明自己仍在AI最前沿。
如果把这场大会开在半年以前,那么它将无比精彩:AI协助办公、AI搜索、AI编程,每一项都是重要的技术应用。只可惜在此之前,微软已经把所有的路都走了一遍。
现场观众的反应甚至可以说有点冷淡。事实上,现场只出现了两次热烈的欢呼:Bard的暗黑模式,和Pixel平板免费赠送底座。
在今天的I/O大会上,Google发布的新产品、技术都像是对微软和OpenAI的一次追赶——追赶那个被抢先实现的AI未来。
PaLM2,Google反击GPT-4的秘密武器
大语言模型目前俨然成为了科技圈最顶尖的产品,各家公司都希望能够拿出能够叫板GPT的自研模型,以证明自己的科研实力,Google也不例外。
Google发布了全新一代的大语言模型PaLM2,与GPT-4对抗。
根据Google介绍,他们用了大量数学和科学数据集对PaLM2进行训练,相比去年的PaLM模型,PaLM2在多语言处理、推理和编码能力上有了很大的提升。
原文地址在下方⬇️:https://ai.google/static/documents/palm2techreport.pdf
根据Google的官方测试,PaLM2的部分结果(例如数学)比GPT-4还要好。
Google并没有透露PaLM2具体的参数规模,只提到PaLM2是基于最新的JAX和TPUv4计算设施构建的。Google对PaLM2做了算法优化,使得它在体积上比PaLM要小,但整体性能更好,计算效率更高。
PaLM2支持100多种不同的语言和20多种编程语言,包括JavaScript、Python、Prolog、Verilog、Fortran等,可以说是个语言通。
仅能做常规的文字理解和生成还不够,支持多模态的PaLM2还能看懂和生成音视频内容,Google展示了一个名为Med-PaLM的专为医疗领域微调的模型,可以根据X光片分析病人伤势,Google其在这方面已经达到人类医生的水平。
PaLM2模型还可以「拆分」成不同大小的4种版本,在各种设备上部署。例如在智能手机上就可以运行规模比较小的Gecko模型,让移动端也能拥有大语言模型。
值得一提的是,PaLM2目前已经开放预览,Google自家的聊天机器人Bard已经用上了PaLM2模型,增强自己的作答能力。Google内容已经有超过70个产品团队在使用PaLM2构建产品,本场大会上绝大部分更新都是基于PaLM2模型设计而来,可以说PaLM2就是Google全面AI化的核心引擎。
除了PaLM2,GoogleCEO桑德尔·皮查伊还稍微了剧透了一点下一代大模型Gemini(双子座)的消息,他称Gemini旨在实现多模态、高效和为未来创新而构建。。
Gemini是GoogleBrain和DeepMind两个顶尖AI团队合并后共同开发的全新模型,从命名上可以看出,Gemini将会集二者之所长,有望挤入最强大的大语言模型之列。
Bard:升级多模态,能画图也能读图
更好看,更综合,更多人可以用到。
在不到2个月的更新后,Google将Bard迁移到功能更强大的大语言模型PalM2,这个ChatGPT和BingChat的竞争对手得到了大幅更新,能力更强大:
取消等候名单,向180多个国家和地区开放;新增图片问答,对话更加直观;整合AdobeFirefly,快速生成图片;来源引用、深色模式、代码导出按钮,更多细节更新。
英美限定、只会英文、等候名单,想用到限制颇多的Bard并不是件容易事。即日起,Bard正式宣布取消等候名单,并向180多个国家和地区开放体验。
Bard现在还支持了日语和韩语,很快就会将支持语言扩大到40种,包括中文。
功能方面Bard也有不小的升级,用四个字总结就是「图文并茂」。询问Bard问题时,它不再是一个只会干巴巴回复文字的机器人,还能用图片的形式为我们展示更丰富直观的答案。
同时,Google还将GoogleLens的能力带入了Bard,让后者不仅可以回复图片,还能看懂图片,根据图片信息起草内容。比如,你可以把一只狗的照片发给他,让它根据狗的品种来写一些标题。
或许是隔壁文生图的功能好评声音太大,Google也为Bard新增了这一功能,不过它是与AdobeFirefly合作的,整合了Firefly的Bard,就可以用自然语言生成高质量图像了。而且有了Adobe的背书,图片的版权、质量都不需要担心。
Adobe只是开始,Google还将与Kayak、OpenTable、zip招聘公司、可汗学院等多个合作伙伴与同努力,为Bard增加更多功能。
相比ChatGPT,Bard的定位更偏向BingChat,兼顾搜索引擎与生产力工具的它,会在下周加入引用功能,并为生成的代码展示来源以确保准确性。并新增了导出、运行代码的能力,方便开发人员高效工作。顺便还新增了深色模式,引起了现场欢呼。
虽然初登场时闹过一些乌龙,但Google还是让我们看到了一个不断进步的Bard。只可惜在介绍中我们听到最多的词还是「we’ll」,等今日发布的功能全部实装上线后,Bard就是一款足够全面且成熟的工具了。
DuetAI:办公的事交给AI做
Copilot的竞争者来了。
Google为自己的Workspace引入了一个全新的工具DuetAI,让我们看到了AI在基于云计算的Google办公套件中扮演的角色:
文档:总结全文、自动编写;幻灯片:文生图,提高效率;表格:分析数据,制定策略。
在Google文档中,你可以告诉DuetAI想要创作的内容,让它自动生成文章。你也可以让它根据需求生成不同文风。
「阅读」文章、重点提问的类「ChatPDF」功能也没落下。
这些文字生成、扩写、调整的能力,同样也应用在GoogleMail里。
幻灯片方面,DuetAI扮演着一个图片生成器的角色,可以帮你节省在互联网上找图的时间,并用原创内容来丰富幻灯片。
在表格里,DuetAI可以根据你的提问自动整理数据,让数据更加规范。
这些能力也可以与其他Google服务进行联动,比如当你在Bard中创建好一个表格后,可以一键生成表格文档,方便后续使用。
DuetAI还增加了一套机器学习驱动的Google云开发工具,可以提供实时代码纠错、生成等,支持Go、Java、Javascript、Python和SQL等多种开发语言。
不用等Bard通过的我们,现在又可以等DuetAI了,如果你想体验这些功能,还是需要加入等待名单,等待Google在对应地区开启测试。
总体来说,DuetAI少了些初见Copilot的惊艳,功能演示上似乎也弱了一些。但Bard用不到两个月的时间便迎头赶上,期待DuetAI能带来更多可能性吧。
Google搜索:重新定义,全面全能
未来的搜索,或许应该长这样:
在PaLM2的驱动下,Google搜索也迎来了革新,推出了全新的搜索引擎SGE(SearchGenerativeExperience),你不需要再把一个大问题分割成多个小问题,搜索后再把答案凑起来,有了生成式AI的加持,你可以让搜索干一些重活了。
大会中,Google重点展示了生成式AI在购物方面的提升,当你使用Google搜索一款产品时,你会看到它的产品描述、评论、价格和展示图。
拥有超过350亿产品列表的Google,还在以每小时18亿的速度不断更新着,通过Google搜索购物,你可以获得更新鲜、可靠的结果。
Google认为,广告是互联网的重要组成部分,他们将继续坚持对广告透明度的承诺,并保证广告和搜索结果的区分。
今天Google将开放搜索实验室的注册,并在未来几周内开启访问,支持Googleapp和Chrome浏览器。申请链接如下:labs.google.com/search
Google的AI焦虑,只能用AI来解
有人戏称本届GoogleI/O应该叫做GoogleAI/O,微软和OpenAI的珠玉在前,Google少了一点令人高呼Amazing的时刻,但这无疑也是Google近年来最为坚决的一次自我革命。
自称AI-first的Google,却一直因为过于谨慎保守的策略多次错失先机。如今Google也终于意识到自己必须快速行动,就像Google多位高管所说的那样要「大胆而负责任」,不能再因为害怕犯错而踌躇不前了。
当然AI也并非万能药,大升级后的Bard也未必能改变Google搜索被颠覆的趋势。但毫无疑问,AI会重塑搜索,彻底改变这种交互方式。
份额远不如Google的Bing已经通过聊天机器人,在短短几个月达到超过1亿的日活跃用户,进行了超过5亿次聊天,其中70%尝试新Bing聊天功能的用户,都会用来进行搜索相关的任务。
当全球最大的搜索引擎决定抛下过往包袱,完全拥抱这个趋势,被改变的或许就不仅仅是Google的未来,更可能颠覆互联网的运行机制,改变数十亿的用户的交互。
一个全新、更简洁的世界将会来临。