全球主机交流论坛

标题: 突然发现国产kimi大模型比gpt4o 以及gemini 1.5要好 [打印本页]

作者: tows3    时间: 2024-5-19 15:20
标题: 突然发现国产kimi大模型比gpt4o 以及gemini 1.5要好
问题如下:
100Mb的上传网速,上传2T的内容,需要多久时间?




这3个模型问了五次,gpt4o 以及gemini 1.5 每次都答错。

kimi 每次都对了。



作者: ioioio    时间: 2024-5-19 15:22
KIMI他的数据那里来的???来自百度还是自己数据?
作者: 难人    时间: 2024-5-19 15:24
对对对,锁死kimi
作者: youtonghy    时间: 2024-5-19 15:24
一个问题也不能代表所有问题,gpt做不对小学题也不代表做不对专业问题
作者: vjk52vjk    时间: 2024-5-19 15:28
提问的方式很重要
作者: 赤坂    时间: 2024-5-19 15:30
本帖最后由 赤坂 于 2024-5-19 15:43 编辑

试了一下,4o还真算错了,和正确答案差了半小时
但是别的问题kimi是错的,4o是对的
比如
主机甲和主机乙之间已建立TCP连接,主机甲向主机乙发送了三个TCP段,其中有效载荷长度分别为200、300、500字节,第三个段的序号为1000。传输过程中第二个段丢失,随后主机甲因超时重发了第二个段,主机乙收到该重发段后,返回的确认号是___________。

不能光靠做题目判断哪个好
作者: xinmang    时间: 2024-5-19 15:31
用英文,4o是没问题的,中文确实推荐kimi
作者: 咯拉无米    时间: 2024-5-19 15:32
本帖最后由 咯拉无米 于 2024-5-19 15:34 编辑

46.6
chatgpt4 和我们公司内部调用模型都是这个结果
作者: imslc    时间: 2024-5-19 15:43
你怎么判断哪个是对的哪个是错的?你有实际上传过么?
作者: karson    时间: 2024-5-19 15:49
其实你这个问题是有歧义的……
进制到底是1024进制还是1000进制,不同的进制有不同的答案。
文件是1024没问题,网速到底是1000还是1024呢?这个不好说啊,因为技术上应该是1024,但是行业内经常用1000……

我问了GPT-4o,因为提供的是100Mbps(这个数字不是二的幂),所以GPT列式出来认为网速是1000进制,然后算出来是48.867小时,验算了一下在这个前提下是正确的

然后我又追问了:如果网速是1024进制,结果又是多少
GPT-4o得出的结果是正确答案46.6小时


PS: 我稍微修改了问题:“100Mbps的上传速度,上传2TB的文件,需要多长时间?”
作者: tows3    时间: 2024-5-19 16:03
karson 发表于 2024-5-19 15:49
其实你这个问题是有歧义的……
进制到底是1024进制还是1000进制,不同的进制有不同的答案。
文件是1024没问 ...

我试了好几次,gpt4o ,可能偶尔能对一次。

最接近的是回答36小时,如下


要么77天或者77年


作者: tows3    时间: 2024-5-19 16:04
咯拉无米 发表于 2024-5-19 15:32
46.6
chatgpt4 和我们公司内部调用模型都是这个结果

我网页测试了好几次,都没有对。用API反而对了
作者: 我是老王    时间: 2024-5-19 16:06
对的 KIMI最强了
作者: tows3    时间: 2024-5-19 16:08
tows3 发表于 2024-5-19 16:03
我试了好几次,gpt4o ,可能偶尔能对一次。

最接近的是回答36小时,如下


回答要5.57年的都有



作者: @Shuai    时间: 2024-5-19 16:11
kimi 收费吗
作者: ftlh2005    时间: 2024-5-19 16:53
其实kimi挺垃圾的,问了点代码问题,每次都答非所问
作者: wzlgdw    时间: 2024-5-19 17:13
kimi.ai 是国人弄得嘛
作者: karson    时间: 2024-5-19 17:31
tows3 发表于 2024-5-19 16:03
我试了好几次,gpt4o ,可能偶尔能对一次。

最接近的是回答36小时,如下


不应该啊,我又直接用原话试了一次,还是答对了=。=




作者: 68y    时间: 2024-5-19 17:34
kimi真的垃圾 我用翻译 把一个专业名词翻译错了 导致白白浪费两三天时间找问题出哪儿天的时候
作者: karson    时间: 2024-5-19 17:35
tows3 发表于 2024-5-19 16:03
我试了好几次,gpt4o ,可能偶尔能对一次。

最接近的是回答36小时,如下

我知道了,是你那边的输出有问题。你每次都要问他时间是多少它才输出,你使用的客户端是不是不自带计算器= =

GPT列的那条算式是正确的:(2^41)/12.5*(1/1024^2)出来的就是秒数,再除3600就是46.6小时

因为你的客户端用不了计算器,所以它没能输出结果。你追问它结果的时候它就只能嗯给你口算了,就废了。别说AI了,人也口算不出这样的算式吧
作者: Ge0metry    时间: 2024-5-19 18:28
本帖最后由 Ge0metry 于 2024-5-19 18:30 编辑
100Mbps的上传速度,上传2TB的文件,需要多长时间?

两个模型用的问题都是一样的。

Kimi和gpt-4-turbo-2024-04-09(gpt是官网key直连)


作者: jamesbonde    时间: 2024-5-19 18:51
我发现搜索东西用抖音的豆包也非常棒,感觉跟Kimi一个等级。比百度搜索高几百个等级,有了豆包和Kimi,感觉百度搜索快要挂了。
kimi的一个致命bug是安卓客户端很多时候没回答完就卡死了,烦的很。




欢迎光临 全球主机交流论坛 (https://lilynana.eu.org/) Powered by Discuz! X3.4