网站在线发布网站外链,友情链接,网站收录,APP推荐

友情链接互换买卖平台

谷歌 Gemini 在手机上能做什么?

后台-系统设置-扩展变量-手机广告位-内容广告位一

彭博社消息称苹果正在与 Google 进行谈判,希望将 Gemini 集成的 iPhone 当中,为 iPhone 的软件提供 AI 相关的新功能。把新系统的核心功能“外包”给第三方,这种做法非常不苹果。

其实苹果自己也在 AI 上做了不少投入,比如在消息传出的同期,苹果发布了自研 MM1 大模型论文,这是一个最高拥有 30B 规模的多模态 LLM,但苹果迟迟没有公布公测时间,也没有对外宣布任何上线计划。据知情人士接触到苹果内部团队后了解,团队认为自家的大模型与主流的 GPT4、Gemini 相比“不具备竞争力”,才开始寻找第三方合作商。

或许在 6 月即将举行的 WWDC 2024 上,苹果会公开自研模型的进展与第三方厂商的合作计划,毕竟届时需要对所有用户和开发者展示 iOS 18 的核心卖点。而 iOS 18 被苹果内部誉为史上升级最大的一个操作系统版本的原因,就是苹果宣称 iOS 18 上的 Siri 将会真正的成为用户的“私人助理”。

如果该合作确认落地,那由于合规问题,苹果需要在国内找一家公司进行合作,而不是直接使用 Gemini。

据了解,苹果此前曾三家公司洽谈合作 AI 大模型,其分别有百度的文心一言、阿里的通义千问、月之暗面的 Kimi,但目前概率最大的还是百度,毕竟在三星最新一代的 S24 系列产品上,大陆以外发售地区的 AI 合作方也是 Gemini,而大陆则是以百度、美图为首的一众中国大模型公司。

Gemini 在手机上能做什么?

为了了解目前 Google 在手机上能够实现哪些 AI 功能,我们找到了一台 Google Pixel 8 Pro,这是 Google 目前唯一能够运行 Gemini Nano 端侧大模型的机器,可是在体验之后,我们发现目前 Gemini 目前的大多数功能都十分依赖网络,端侧模型 Gemini Nano 能够做的事儿十分有限。

刨除因为中文系统语言设定暂不开放的功能,目前 Google Pixel 8 Pro 上面的 Gemini 可以为用户提供八大核心功能:

一.魔法修图

在 Google 相册中点选“编辑”按钮,你就可以在左下角发现一个彩色的“魔法修图”图标,选择后用户就可以对照片中想要编辑的内容进行框选,框选后你不仅可以进行消除,还可以进行缩放处理。但需要注意的是,每张图片在处理之前一定要上传到云端的 Google 相册进行“备份”,并且在图片处理的过程中需要保持联网

图源:品玩 LU

选择擦除后,大模型会对擦除的主体后面的画布进行“想象”并生成补充内容,并给出 4 张反馈供用户选择。在该步骤下,AI 需要识别图片中的物体,并学习该物体的大概轮廓,对应的在数据库中进行比对并给出补充。

图源:品玩 LU 摄

可以看到,将图中女人删除后,Gemini 对香港的红色出租车的细节补充还是比较到位的。

你也可以将画面中的主体进行缩放,这个功能非常适合在景点合影时,修正人物不够突出的构图效果。

图源:品玩 LU

二、“魔法换天

在没有主体的风光照中,你也可以依靠 Gemini 对照片进行不同“时空”的转换,比如这张维多利亚港的风光照,我们点击魔法修图按钮后,可以看到 AI 判断我们可以针对天空、日落、风格化、和水进行四个大方向的调整。

图源:品玩 LU 摄

这个功能非常类似小米手机上很出名的“魔法换天”,不得不说日落时分这张做的还蛮有感觉的。

图源:品玩 LU

水面的修改就差了点意思,修改后的这张照片拍摄视角仿佛我站在水里……

图源:品玩 LU

风格化的本意,是 Google 根据照片生成一张场景相同但不同风格照片,但 Gemini 直接把维多利亚港变成了田野……

三、音频橡皮擦

这应该算是本次 Google Pixel 手机“ AI 化”之后,我个人觉得唯二能体现 AI 效果的功能。在该功能下,Gemini 能够将一段视频中的的声音进行分层,并且选择性保留。

图源:品玩 LU

如果你是一个 Vlog 拍摄者,在拍摄例如展会等视频素材时,就可以将展览周围的人声和噪音隔绝,只保留拍摄者自己的声音,然后配上一段合适的音乐,会给你的剪辑工作省下不少的时间。

本文来自微信公众号:不客观实验室 (ID:gh_719281df296b),作者:陆
后台-系统设置-扩展变量-手机广告位-内容广告位二

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Top