今年的 Google I/O 大会,亮点有哪些?

谷歌 I/O 大会如约而至。北京时间 5 月 12 日凌晨1点,谷歌 I/O 2022 大会开幕式上,谷歌 CEO Sundar Pichai 发表了长达 2 小时的以“知识和计算”为关键词的主题演讲。这次演讲在勾勒谷歌长期发展愿景的同时,也在某种程度上描绘后疫情时代的互联网技术的演进方向。


搜索再定义:Anyway、Anywhere

Google 提出「Search reimagined. Any way and anywhere」(重新构想搜索。以任何方式和任何地方)的愿景。

可以这样解读:搜索正在成为一个多传感器、多设备的命题,它既能理解“谁在搜索”,也能理解“他们真正在寻找什么”。它还将搜索体验扩展到了问题和答案之外。它让安卓系统更加关注环境和内容,这样手机就可以根据用户实现“千人千面”;它强调自然的互动,这样你就可以在不死记硬背命令的情况下获得信息;它正在构建所需的硬件生态系统,使所有这些设备在任何地方都能工作,并使软件与之匹配。

谷歌于上个月推出了 Multisearch 功能,即当你在日常生活中,遇到根本就不认识,或者无法描述的东西时,可以直接以拍照和提问的方式在谷歌应用中进行搜索。此外还有“Scene Exploring”功能,将允许用户使用手机相机功能直接扫描超市的货物,然后查找到自己想要的产品。

图源:谷歌

谷歌还扩展了其多搜索功能,可以沿多个维度进行搜索。例如,你可以给谷歌一张你正在寻找的特定类型菜肴的图片,然后问它你在附近哪里可以找到。


AR:真实世界里的理解与被理解

信息技术领域有了一个新战线,增强现实技术(AR),它拥有推动现有技术继续发展的潜质。这个潜质不是技术本身,而是让我们更加关注这个真实的世界。谷歌提出了这样一种理念:我们基于现实世界进行创作设计,绝不脱离现实。AR 恰恰是能够帮助我们实现这种设计理念的新方法。

Google Glass V2 图源:谷歌

以语言为例,语言是人与人之间沟通的基础。然而,如果对方讲着另一种语言,或者会话的一方有听觉障碍时,沟通就变得困难重重。谷歌将最新技术应用在翻译和语言转录中,其在早期测试原型中呈现出来的效果赢得了现场观众一片掌声。


人工智能:遍地开花“料”十足

与通常情况一样,此次的谷歌 I/O 有很多人工智能方面的“料”。首当其冲的是宣布公开 LaMDA 2,Google 目前打造的最先进的对话 AI 模型,较之前版本相比,减少了不准确或冒犯性的回复,显著提升了对话质量。不但如此,谷歌正在将这项技术应用到搜索和其他产品中。

再有,YouTube 视频可以自动生成章节和转录。通过 DeepMind 的多模式技术,YouTube 视频以更高的准确性自动生成章节。也能使用语音识别模型来转录视频。

再比如,Google Docs 引入自动摘要功能。这一功能的落地,也标志着自然语言处理的一大飞跃。通过机器学习模型,Google Docs 可以自动解析单词并提炼出要点,且只需几秒的时间。

值得一提的是,谷歌宣布了迄今以来自研的最大规模的语言模型 PaLM,该模型基于 5400 亿参数训练而成。将这种大规模模型与一种名为“思维提示链(chain-of- thought)”的新技术结合起来时,可以将需要多步解决的问题转化为一系列的中间步骤来处理,效果令人非常满意。

思维提示链   图源:谷歌

还有一些与人工智能相关的小插曲。谷歌宣布,其自动生成的翻译将出现在手机上的 YouTube上,你只需看看 Nest Hub Max,就可以开始与助手通话;你的手机也可以看到一个装满巧克力棒的架子,根据你要找的东西为你挑一个。如谷歌所描述的,“为你周围的世界提供了一个超级强大的Ctrl-F”。

图源:谷歌 

Andriod 13:完善也是一种强大

谷歌重新审视了 Andriod 13的计划,下一个版本的移动操作系统似乎在 Andriod 12 中引入的理念上走得更远。谷歌正在向更多的位置添加内容主题,允许用户将应用程序设置为使用不同的语言,并添加了一些安全和隐私功能。实用功能方面,值得注意的是 Android 13 支持运行 Windows了,据称已经有人在搭载了Android 13 开发者预览版的谷歌 Pixel 6上成功运行了 Win11 Arm 虚拟机,并且实现近乎原生的性能。

除此之外,Android 13 还支持在锁屏界面添加 QR 扫描器、点击流转媒体、新增系统照片选择器等多项新的功能,并且还可以为单个 App 指定语言等,这些都是非常实用的。

安卓系统现在内置了对智能家居标准的支持,这将使安装和控制新设备变得更加容易。谷歌扩展了对其向其他设备发送音频和视频的 Cast 协议的支持,并改进了其快速配对服务,以方便连接蓝牙设备。

整体上看,Andriod 13 与 12 相比,没有太大的改动,而是沿着其理念继续在许多细节上做了进一步的优化处理,使安卓的生态更加完善与强大。

新的测试版已经发布,安卓迷们可以尝鲜了。

图源:谷歌


张量芯片:在本地而非云端

谷歌宣布计划明年发布一款 Android 平板电脑,相信不少安卓开发者都梦想拥有一个“更大尺寸像素的完美伴侣”。谷歌希望再次进入平板电脑市场。其中吸引人的地方,在于一个硬件细节:张量芯片。

图源:谷歌

谷歌正在努力创新自身的移动平台,希望更多的数据处理就可以在本地设备上进行,而不是在云端进行。Google 定制的 Google Tensor 芯片是朝此方向迈进的重要一步。Pixel 6 和 Pixel 6 Pro 旗舰手机已搭载 Google Tensor 处理器,让用户手机直接拥有 AI 功能,比如谷歌的语音识别技术。而且,与 Android 的 Private Compute Core 结合后,这项技术可以直接在设备上运行数据驱动的功能,保护用户隐私。


谷歌钱包:重新发布

大会提及 Google Wallet 时,席下一片惊呼。此次谷歌钱包的重新发布,带来了一些非常应景的功能。它不仅可以存放你的支付卡,还可以存放你的通行证、奖励计划会员资格、疫苗接种记录等。谷歌表示,这款应用是为数字身份时代设计的。也就是说,它可以直接作为驾照、银行卡、登机牌、门票使用,同时,它也可供 WearOS 用户使用。


图源:谷歌


谷歌地图:“沉浸式视图”

谷歌为地图添加了一种新模式,基本上是从天空看街道——在选定的城市,你可以获得一个位置的概览,以便在迷路之前更好地了解地理。

伦敦、旧金山、纽约、洛杉矶和东京一起首次亮相的沉浸式视图。图源:谷歌

这项新功能的吸引人之处在于,它与无人机飞行拍摄不同,而是使用神经渲染技术,仅通过图像创造的体验。它利用 3D 绘图和机器学习技术的进步,融合数十亿张航拍和街景图像,以创建一个新的高保真的地图。

这些突破性的技术结合在一起,为用户提供了一种沉浸式视图的新体验,使用户能够以前所未有的方式探索一个地方,例如:假设用户计划和家人一起参观威斯敏斯特。用户现在可以直接从手机上的 Google Maps 获得这种身临其境的视野,还可以在景点周围移动,查看周围的交通情况和娱乐场所等。

Google Cloud Immersive Stream 让这种体验可以在几乎所有智能手机上运行。这项功能将于今年晚些时候在 Google Maps 中针对全球部分城市推出。


隐私安全:减少收集和使用用户数据

安全方面,谷歌历来被诟病的是用户隐私的安全问题。

谷歌也在推进一个没有密码的未来。它不仅将两步验证作为所有人的默认设置,而且将创建一个使用多个系统的身份验证系统,这样人们就不必记住数百个密码。  

谷歌正在为 Android 和 Chrome 用户带来虚拟卡。这将在线上购买商品时生成一个虚拟信用卡号。这样可以使零售商隐藏数字,从而降低欺诈和身份盗用的风险。

谷歌还宣布了“受保护计算”,这是一个使用模糊数据来将用户匿名的系统。使用人工智能和云计算会改变处理数据的位置和方式。谷歌还将最大限度地减少个人使用的数据,并将减少收集并删除更多公司限制访问,以便包括谷歌在内的公司不会过度使用用户的个人数据。谷歌还表示,除了“受保护计算”的概念外,公司还专注于在默认情况下为其产品实施额外的安全功能,以便在设备上进行更多处理,而不是将数据发送到其他地方。

同时, 在谷歌发布的一整套安全和隐私声明中包括了“我的广告中心”界面的计划:用户可以通过从感兴趣的主题中选择一系列内容来定制他们看到的广告类型,或者选择在给定主题上少看广告。


图源:谷歌


写在最后  

谷歌 I/O 大会,可以说是移动互联网技术与产品的大观园。简单总结一下:

搜索方面:谷歌提出了“重新构想搜索,任何方式、任何地方”的愿景。在数字化时代,推出 MultiSearch、Scene Exploring 等新功能。

移动开发系统:Andriod13 新的测试版本较以往版本,注重了生态的完善性,以及设备之间的协同能力。

人工智能:谷歌一直视AI为赋能服务和产品的重要引擎,并且着重聚焦在对话AI、NLP等技术领域。

XR 发展:“基于现实世界创作设计,不脱离现实”的理念非常清晰,从打造沉浸式体验的谷歌地图、到 Google Glass V2,这是元宇宙兴起后的新的产品探索与尝试。

安全方面:不管是尽量让数据处理在本地完成、还是“受保护计算”系统、“我的广告中心”的推出,都昭示着谷歌将用户的隐私数据放到了足够重视的位置。

跳出技术的范畴来看谷歌,谷歌作为老牌的互联网玩家,我们看到它正逐渐跳出“搜索框”,通过多种传感设备数据去“理解”并“讨好”用户,不再局限于打造“好用”的产品,而是更注重好产品如何以用户为中心去做更好的协同。

从“理解互联网”到“理解用户”,笔者认为,这可能是如今互联网后半场所有企业共同面对的命题。