人工智能将是谷歌I/O年度开发者大会的一个中心主题。美国消费者新闻与商业频道获悉,该公司计划在周三的年度开发者大会上宣布生成式人工智能的一些更新,包括推出通用大型语言模型(LLM)。
根据美国消费者新闻与商业频道获得的有关Google I/O的内部文件,该公司将推出PaLM 2,这是其最新、最先进的LLM,涵盖100多种语言,并在内部代号下进行了广泛的编码、数学测试、创意写作和统一语言模型的分析。
在这次活动中,谷歌将宣布AI如何“帮助人们充分开发潜力”的主题,并进行一次与Bard和搜索相关的“生成体验”。谷歌首席执行官桑德尔·皮帅将向开发者发表现场演讲,介绍该公司的人工智能进展。这些更新是在AI竞赛进一步升级的背景下推出的。谷歌和微软正在竞争将聊天人工智能技术融入他们的产品。微软正在利用其对聊天人工智能创建者OpenAI的投资来增强其Bing搜索引擎,而谷歌正在迅速采取行动,试图在各个团队中整合其Bard技术和LLM。
谷歌于2022年4月首次公布了PaLM语言模型。今年3月,该公司推出了PaLM API和一系列人工智能企业工具,称这些工具可以帮助企业“从简单的自然语言提示中生成文本、图像、代码、视频、音频等内容”。上个月,谷歌表示,其名为“Med-PaLM 2”的医学LLM可以回答“专家医生”级别的医学考试问题,准确率高达85%。此外,谷歌还计划分享Bard和search在“生成体验”方面的进展,包括将Bard用于编码、数学和“逻辑”,以及扩展日语和韩语。
根据美国消费者新闻与商业频道看到的另一份文件,该公司一直在研究一系列更强大的Bard模型,并在今年3月正式推出它们作为实验工具。该公司内部开发了一个名为“Multi-Bard”的多模态版本,它使用了更大的数据集,可以解决复杂的数学和编码问题。谷歌还测试了名为“大吟游诗人”和“巨人吟游诗人”的版本。
谷歌还计划扩大其“Workspace AI collaborator”,包括讨论在表格中生成模板以及在幻灯片和Meet产品中生成图像。今年3月,谷歌表示,将为少数用户提供在Gmail和谷歌文档中使用人工智能功能的测试,并计划为其Meet、Sheets和Slides应用程序带来额外的生成式人工智能功能。
美国消费者新闻与商业频道查看的一张图片显示,幻灯片的侧边栏中有一个聊天框,用户可以输入文本并选择“创建”一个基于文本的图像。其他更新包括图像识别工具Google Lens的用例。谷歌将展示相机和语音“多重搜索”的进展,去年它还允许用户对图像中的内容提出问题。
在人工智能领域之外,谷歌将展示新的折叠手机Pixel Fold,这是美国消费者新闻与商业频道之前报道的。谷歌声称,Pixel Fold将拥有“折叠”手机中最强的铰链,并提供以旧换新手机的选项。谷歌计划将Pixel Fold宣传为防水和口袋大小。