1. 智谱清言
- 平台地址: https://www.bigmodel.cn/
- API请求地址: https://open.bigmodel.cn/api/paas/v4/chat/completions
- 免费模型: GLM-4-Flash
- Tokens: 无限
- 建议最大线程数: 50
- 模型简介: 不限量使用,支持200线程并发
- 备注: 并发策略详见 官方文档
2. 科大讯飞
- 平台地址: https://console.xfyun.cn/services/cbm
- API请求地址: https://spark-api-open.xf-yun.com/v1/chat/completions
- 免费模型: lite
- Tokens: 无限
- 建议最大线程数: 1
- 模型简介: 不限量但限速(QPS=2),需实名认证后免费使用
- 备注: 实名认证入口 点击此处
3. 腾讯混元
- 平台地址: https://console.cloud.tencent.com/hunyuan/api-key
- API请求地址: https://api.hunyuan.cloud.tencent.com/v1/chat/completions
- 免费模型: hunyuan-lite
- Tokens: 无限
- 建议最大线程数: 5
- 模型简介: 限速5次/秒调用
- 备注: API使用指南参考 官方文档
4. DeepSeek本地部署
- 平台地址: https://ollama.com/
- API请求地址: http://localhost:11434/v1/chat/completions
- 免费模型: deepseek-r1
- Tokens: 无限
- 建议最大线程数: 根据本地配置调整
- 模型简介: 完全免费,需自行部署至本地环境
- 备注: 无额外限制,性能依赖硬件资源
5. 通义千问
- 平台地址: https://bailian.console.aliyun.com/
- API请求地址: https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
- 免费模型:
- qwen2.5-1.5b-instruct(限时免费)
- qwen2.5-0.5b-instruct
- qwen2-1.5b-instruct
- qwen2-0.5b-instruct
- qwen1.5-1.8b-chat
- qwen1.5-0.5b-chat
- qwen-1.8b-chat
- Tokens: 部分模型限时免费,需实时确认
- 建议最大线程数: 1
- 模型简介: 限速QPM=60,不同模型规格差异较大
- 备注:
- 模型列表与限速策略详见 模型广场
- 注意风险: 可能存在今天免费、明天收费导致账号欠费情况,使用前务必确认费用状态