Google 推出的原生多模态 AI 模型 Gemini,强调是从头开始建立的多模组 AI 模型,就像人类有五感,同时接收和感知这个世界一样,可以像人类一样概括和无缝地理解、操作和组合不同类型的讯息,包括文字、程式码、音讯、图像和影片等等。有 12 万订阅的 TheAIGRID 在近期影片中详细介绍了 Gemini 的各项功能,看了只能赞叹地说「回不去了!」
可看可听可写,天南地北随便聊
Gemini 强调是从头开始建立的多模组 AI 模型,就像人类有五感,同时接收和感知这个世界一样,而这也意味着 Gemini 可以像人类一样概括和无缝地理解、操作和组合不同类型的讯息,包括文字、程式码、音讯、图像和影片等等。
这表示你可接上镜头、麦克风,用图像搭配上语音同时向 Gemini 提问,而且是连续性的,就像朋友间天南地北的随便闲聊,还可以跟它玩游戏。
(影片 5:20 处开始)
最强 AI 顾问 Gemini
Gemini 还是最强的 AI 顾问,影片中示范了「想给女儿举办生日派对」的任务,并提供喜爱动物和想在户外开派对的条件,Gemini 立即生成了数种方案供其选择。
而且 Gemini 的生成形态同时融合了文字、图片。它提供的派对主题方案,还帮你设想了派对的布置、可以准备的活动,还有食物等等,你可自行点选喜欢的主题,进一步查看细节,或者直接在细节处询问更多问题,像派对的杯子蛋糕有哪些造型,要如何自己制作等等,简直就是地表最强 AI 顾问!
(影片 13:47 处开始)
最强家教,上传考题教你解
使用者也可直接上传考题, Gemini 会先帮你改考卷,再告诉你哪里有错,并一步一步地解题给你看,有不懂的地方可以随时提问,甚至请它再出类似的考题,来确保你已完全了解了这种题型的观念。
(影片 17:15 处开始)
此外,你还可以上传自己练习踼球的影片,请 Gemini 指正你的姿势要如何调整,才能顺利进球。
(影片 27:10 处开始)
地表最强 AI 模型
Google 的 AI 聊天机器人 Bard 已开始使用 Gemini Pro 的微调版本来进行更高级的推理、计划、理解等。Google 也将 Gemini 引入 Pixel 手机中,并在接下来的几个月出现在更多的产品和服务中。
从影片中不难发现,Gemini 不止是聊天机器人,它还可以绘图、帮科学家整理海量的资料,并整合成你指定的形式,简直就是地表最强 AI 顾问,也难怪 Google 及 Alphabet 执行长 Sundar Pichai 可以自豪地表示:
这是我们迄今为止最强大、最通用的模型,我对未来以及 Gemini 将为世界各地的人们带来的机会感到由衷的兴奋。
原创文章,作者:惊蛰财经,如若转载,请注明出处:http://www.xmlm.net/kuang/38969.html