Feat : add deepseek support for tongyi (#13445)
parent
939a9ecd21
commit
75113c26c6
@ -0,0 +1,21 @@
|
|||||||
|
model: deepseek-r1-distill-qwen-14b
|
||||||
|
label:
|
||||||
|
zh_Hans: DeepSeek-R1-Distill-Qwen-14B
|
||||||
|
en_US: DeepSeek-R1-Distill-Qwen-14B
|
||||||
|
model_type: llm
|
||||||
|
features:
|
||||||
|
- agent-thought
|
||||||
|
model_properties:
|
||||||
|
mode: chat
|
||||||
|
context_size: 32000
|
||||||
|
parameter_rules:
|
||||||
|
- name: max_tokens
|
||||||
|
use_template: max_tokens
|
||||||
|
min: 1
|
||||||
|
max: 8192
|
||||||
|
default: 4096
|
||||||
|
pricing:
|
||||||
|
input: "0.001"
|
||||||
|
output: "0.003"
|
||||||
|
unit: "0.001"
|
||||||
|
currency: RMB
|
||||||
@ -0,0 +1,21 @@
|
|||||||
|
model: deepseek-r1-distill-qwen-32b
|
||||||
|
label:
|
||||||
|
zh_Hans: DeepSeek-R1-Distill-Qwen-32B
|
||||||
|
en_US: DeepSeek-R1-Distill-Qwen-32B
|
||||||
|
model_type: llm
|
||||||
|
features:
|
||||||
|
- agent-thought
|
||||||
|
model_properties:
|
||||||
|
mode: chat
|
||||||
|
context_size: 32000
|
||||||
|
parameter_rules:
|
||||||
|
- name: max_tokens
|
||||||
|
use_template: max_tokens
|
||||||
|
min: 1
|
||||||
|
max: 8192
|
||||||
|
default: 4096
|
||||||
|
pricing:
|
||||||
|
input: "0.002"
|
||||||
|
output: "0.006"
|
||||||
|
unit: "0.001"
|
||||||
|
currency: RMB
|
||||||
@ -0,0 +1,21 @@
|
|||||||
|
model: deepseek-r1
|
||||||
|
label:
|
||||||
|
zh_Hans: DeepSeek-R1
|
||||||
|
en_US: DeepSeek-R1
|
||||||
|
model_type: llm
|
||||||
|
features:
|
||||||
|
- agent-thought
|
||||||
|
model_properties:
|
||||||
|
mode: chat
|
||||||
|
context_size: 64000
|
||||||
|
parameter_rules:
|
||||||
|
- name: max_tokens
|
||||||
|
use_template: max_tokens
|
||||||
|
min: 1
|
||||||
|
max: 8192
|
||||||
|
default: 4096
|
||||||
|
pricing:
|
||||||
|
input: "0.004"
|
||||||
|
output: "0.016"
|
||||||
|
unit: '0.001'
|
||||||
|
currency: RMB
|
||||||
@ -0,0 +1,52 @@
|
|||||||
|
model: deepseek-v3
|
||||||
|
label:
|
||||||
|
zh_Hans: DeepSeek-V3
|
||||||
|
en_US: DeepSeek-V3
|
||||||
|
model_type: llm
|
||||||
|
features:
|
||||||
|
- agent-thought
|
||||||
|
model_properties:
|
||||||
|
mode: chat
|
||||||
|
context_size: 64000
|
||||||
|
parameter_rules:
|
||||||
|
- name: temperature
|
||||||
|
use_template: temperature
|
||||||
|
- name: max_tokens
|
||||||
|
use_template: max_tokens
|
||||||
|
type: int
|
||||||
|
default: 512
|
||||||
|
min: 1
|
||||||
|
max: 4096
|
||||||
|
help:
|
||||||
|
zh_Hans: 指定生成结果长度的上限。如果生成结果截断,可以调大该参数。
|
||||||
|
en_US: Specifies the upper limit on the length of generated results. If the generated results are truncated, you can increase this parameter.
|
||||||
|
- name: top_p
|
||||||
|
use_template: top_p
|
||||||
|
- name: top_k
|
||||||
|
label:
|
||||||
|
zh_Hans: 取样数量
|
||||||
|
en_US: Top k
|
||||||
|
type: int
|
||||||
|
help:
|
||||||
|
zh_Hans: 仅从每个后续标记的前 K 个选项中采样。
|
||||||
|
en_US: Only sample from the top K options for each subsequent token.
|
||||||
|
required: false
|
||||||
|
- name: frequency_penalty
|
||||||
|
use_template: frequency_penalty
|
||||||
|
- name: response_format
|
||||||
|
label:
|
||||||
|
zh_Hans: 回复格式
|
||||||
|
en_US: Response Format
|
||||||
|
type: string
|
||||||
|
help:
|
||||||
|
zh_Hans: 指定模型必须输出的格式
|
||||||
|
en_US: specifying the format that the model must output
|
||||||
|
required: false
|
||||||
|
options:
|
||||||
|
- text
|
||||||
|
- json_object
|
||||||
|
pricing:
|
||||||
|
input: "0.002"
|
||||||
|
output: "0.008"
|
||||||
|
unit: "0.001"
|
||||||
|
currency: RMB
|
||||||
Loading…
Reference in New Issue