全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 2376|回复: 16
打印 上一主题 下一主题

deepseek使用的是OpenAI的使用政策?

[复制链接]
跳转到指定楼层
1#
发表于 2025-3-27 23:20:31 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
本帖最后由 绿岛小夜曲 于 2025-3-27 23:23 编辑

为什么会出现这种情况?

推荐
发表于 2025-3-27 23:35:11 | 只看该作者
蒸馏chatgpt,有什么好惊讶的
17#
发表于 2025-3-28 17:51:24 | 只看该作者
目前 DeepSeek Chat 并没有直接蒸馏(distill)OpenAI 的模型(如 GPT-4)。我们的模型是由 深度求索(DeepSeek) 自主研发的,基于大规模高质量数据训练而成,并采用了前沿的大模型技术,包括可能涉及 Transformer 架构优化、高效训练策略等。

不过,知识蒸馏(Knowledge Distillation) 是一种常见的模型优化方法,通常用于将大模型(教师模型)的知识迁移到小模型(学生模型)上,以提高小模型的推理效率。如果未来有相关技术应用,我们会遵循合规的研究方式。

如果你是想问 DeepSeek Chat 是否基于 OpenAI 的技术,答案是否定的——我们是独立训练的。但如果你对模型训练细节感兴趣,可以告诉我,我会尽量解答!
16#
发表于 2025-3-28 17:16:13 | 只看该作者
之前openai还发文说过ds使用其模型训练自己的模型
15#
发表于 2025-3-28 14:19:32 | 只看该作者
这是蒸馏的大模型
14#
发表于 2025-3-28 10:40:17 | 只看该作者
自己不也说了吗,蒸馏的,只是降低了使用成本并开源
12#
发表于 2025-3-28 09:53:45 | 只看该作者
正义猫头哥 发表于 2025-3-28 00:10
我感觉还是chatgpt写代码更强一些,执行的时候报错少,可用性高,deepseek也可以用,2者差别不是特别大。 ...

我感觉grok强。可能是因为我基本只用c#
11#
发表于 2025-3-28 08:02:48 | 只看该作者
本帖最后由 jamesbonde 于 2025-3-28 08:04 编辑

DS厉害之处就在于把别人的东西拿来开源,你还不好批评它,呵呵
它知道拿别人的东西不好,所以一开始就开源了
10#
发表于 2025-3-28 06:57:37 来自手机 | 只看该作者
chatgpt被derpseek脱裤了
9#
发表于 2025-3-28 06:40:54 | 只看该作者
又有活干了,楼主你要被喷死!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-12-15 15:18 , Processed in 0.252074 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表