Deepseek不同版本的使用场景
严格说来,Deepseek只是深度求索公司下的一个AI品牌,Deepseek R1是其中具有推理能力的一个版本。除此之外,它还有不具备推理能力的通用模型Deepseek V3。
R1模型善于解决复杂推理和深度分析任务,如数理逻辑推理和代码编程等开放性任务,我们只需要输入目的,它就可以代替我们思考来解决问题。
是不是所有应用AI的目的都是为了让它代替我们思考呢?是不是给出一个目的都是要希望让AI来帮助我们完成呢?也不是。
其实很多场景下,我们有自己的工作流程,有自己的思考路径,我们需要AI照着我们的流程和思考路径,来帮我完成指定任务下的每一个环节,然后再给出需要的结果。
这个时候就不能用R1模型了,因为它容易发散,容易偏离我们的思考路径。如果要让模型参照我们的思考路径来完成规范性任务,V3模型就能派上用场了。
通俗地说,V3是个听话的孩子,而R1更像是一个聪明但是不太听话的孩子。
除了R1和V3,Deepseek还有联网搜索的功能—RAG(检索增强)。
这里要先普及一个概念:所有的模型都是根据一定的资料库训练出来的,而这些知识库并不是实时更新的。
比如Deepseek最新的知识库截止于2024年的7月。如果我们提出的问题是知识库节点后的问题,就需要联网搜索来解决了。
小结一下,Deepseek有三种使用场景:
第一种,需要推理能力时使用R1模型(深度思索);
第二种,需要按照我们给定的流程时使用V3模型(不选深度思索);
第三种,超出知识库节点的问题需要联网搜索,需要注意的是,联网搜索的信息未经训练,直接用容易干扰既有模型的思考路径。
2.Deepseek使用的三种路径
Deepseek刚出来的那段时间,受世界所瞩目,点击量暴增,经常会出现服务器繁忙的情况,这时候可以使用其它渠道的Deepseek模型来加以解决。
通常情况下,可以通过三种途径来使用Deepseek模型。
第一种,Deepseek官方渠道,包括Deepseek官网、Deepseek APP及API接口。
第二种,第三方渠道。
第三方渠道分为两个阶段,前期主要通过选择国家超算平台、硅基流动、纳米AI搜素、秘塔AI搜索等平台接入的Deepseek模型来实现,但这些通常都不是满血版本(参数量为671B),而是蒸馏版本。这个时期的满血版本是要收费的。
在第二个阶段,腾讯元宝、百度搜索都可以免费使用Deepseek的满血版本,不同的是,腾讯元宝主要基于公众号的相关知识,而百度主要基于百度的搜索网页。
因为大量的第三方平台接入了Deepseek模型,很大程度上减轻了Deepseek官网的访问压力,再使用官网的Deepseek模型,很少出现服务器繁忙的提示了。
最后一种,是本地部署,把Deepseek模型安装到自己本地的服务器来使用。
当然,参数量越大,成本就越高,对于个人来说,低参数版本的蒸馏模型就能满足一般使用要求了。