和顺纵横信息网

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 254|回复: 0

超越了 CatGPT代表的业界

[复制链接]

5

主题

5

帖子

19

积分

新手上路

Rank: 1

积分
19
发表于 2024-2-14 20:35:59 | 显示全部楼层 |阅读模式
本帖最后由 SANYISALMSR404 于 2024-2-14 20:45 编辑

LLM广泛使用的基准测试中,Gemini Ultra有项都最先进水平。 究竟Ultra版本实力如何,现在终于可以上手一探究竟了。 用写LinedIn Post来测试内容生成。结论是Gemini Ultra凭借更多标题选项、更快响应速度和“没有愚蠢的emoji表情”击败GPT-成为绝对胜者。 网友 Alpaetting拿出一道逻辑推理题:Taita喜欢饼干但不喜欢蛋糕,喜欢羊肉但不喜欢羔羊肉,喜欢秋葵但不喜欢南瓜。它询问按照相同规则,Taita会喜欢樱桃还是梨。 Gemini Ultra给出的建议是:“Taita喜欢发音两个音节的食物,不喜欢一个音节的食物。”它列出谜题中每种食物的音节数,由于「cerries」有两个音节,因此答案是樱桃。 GPT-认为Taita的偏好可能与单


词最后一个字母有关。她喜欢的食物结尾是辅音,而她不喜欢的食物结尾是原因。这样的话,樱桃和梨都符合条件——有些棘手,但一定要选一个的话,那就樱桃吧。 他表示Gemini Ultra成功解决了被GPT-搞到稀碎的逻辑测试。 用户rett Winton测试两者的文生图功能,提示词 亚美尼亚手机号码列表 是“生成一个画家试图在火箭外部画静物的图像,让它幽默一些,一幅插画“。左边是GPT-,右边是Gemini Ultra。 AI模型的想象力见仁见智,不过Gemini图像里的画家比起绘画更像在吃东西,手部细节也有点问题。评论里都觉得GPT-更好些。 他又紧接着对比了Gemini Ultra、 Claude和GPT-对于年级数学题计算能力。 题面是:Garcia正策划一





个比萨派对,她需要确保名学生每人至少得到片,每个比萨有片。为增加多样性, Garcia决定订购一半奶酪比萨和一半香肠比萨。然而有名学生是素食者,只会吃奶酪比萨。 请回答: Garcia需要订购多少个比萨,以确保每个学生至少片? 每种类型比萨各多少个? 如果每个比萨美元,总订单费用是多少? 在之前的测试中, Gemini Pro把这道题搞砸了。此次Ultra答对了总数个比萨和费用美元。但第题的正确答案应该是两种比萨各个,Ultra没通过。 rett Winton表示,Gemini Ultra和Claude一样,数学计算都不如GPT-准确。 编码能力上,网友Mervin Praison在

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|和顺纵横信息网

GMT+8, 2025-7-27 19:27 , Processed in 0.036418 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表